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Avi lam yc i n -De ri vate 

15 

Die Erfindung betrifft Avilamycin-Derivate (im folgenden auch als 
Gavibamycine bezeichnet), gentechnologische biosynthetische Verfahren 
zu deren Herstellung, Arzneimittel enthaltend diese Verbindungen, sowie 
die Verwendung dieser Verbindungen zur Herstellung eines Arzneimittels, 
20 bspw. gegen Infektionskrankheiten, wie auch Nukleinsauren, Proteine und 
Gencluster und entsprechende Zellen, die mit der Herstellung dieser 
Avilamycin-Derivate verbunden sind. 



Das Aufkommen pathogener, gegen Antibiotika multiresistenter Bakterien 
25 stellt eine wachsende Bedrohung der menschlichen Gesundheit dar und 
hat die Suche nach neuen Wirkstoffen verstarkt. Immer weniger neue 
Wirkstoffe sind in den letzten zwei Jahrzehnten bei zielspezifischen 
Wirkstoff-Screenings angefallen, so daS Forscher begonnen haben, 
neben der Suche nach neuen antibiotischen Wirkstoffen auch neue 
30 Technologien zur Herstellung neuer Verbindungen zu nutzen. Eine 
vielversprechende neue Technologie wird als kombinatorische 
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Biosynthese bezeichnet und benutzt biosynthetische Gene als Mittel zur 
Herstellung neuer Wirkstoffe. 

Eine unter anderem in diesem Kontext interessante Verbindungsklasse 
5 sind die Orthosomycine. Sie sind eine bekannte Klasse von Antibiotika, 
die von verschiedenen Actinomyceten hergestellt werden. Mitglieder 
dieser Klasse wirken auf eine breite Palette gram-positiver pathogener 
Bakterien, inklusive glycopeptid-resistenter Enterococcen, methicillin- 
resistenter Staphylococcen und penicillin-resistenter Streptococcen. 

10 

Prominente Beispiele an Orthosomycinen sind Avilamycine und 
Evernimycine, die von Streptomyces viridochromogenes Tu57 bzw. 
Micromonospora carbonacea hergestellt werden. Diese Antibiotika 
bestehen aus einer Heptasaccharid-Seitenkette und einer vom Polyketid 

is (Acetateinheiten) abgeleiteten Dichloroisoevernin-Saure als Aglykon, 
wobei die Zucker-Reste zum Teil uber Orthoesterbindungen miteinander 
verknupft sind. Diese Bindung gibt der ganzen Klasse von 
Orthosomycinen den Namen. Der genaue Wirkmechanismus der 
Orthosomycine ist unbekannt. Wahrend fur ein bestimmtes Orthosomycin 

20 (Ziracin) ein Zellmembraneffekt diskutiert wurde (Walker, 1976; Langer, 
1987) wird in neueren Publikationen eine Wechselwirkung mit dem 
ribosomalen Protein L16 angefuhrt (Foster und Rybak, 1999). Fur ein 
anderes Orthosomycin, Avilamycin A, wird eine Hemmung der 
Proteinbiosynthese angenommen und eine Inhibition des Translations- 

25 Initiationskomplexes vorgeschlagen (Wolf, 1973). 

Die bekannten Avilamycine wurden 1959 aus Kulturfiltraten von 
Streptomyces viridochromogenes TQ57 isoliert (Buzzetti, et al., 1968; 
Mertz et al., 1986). Wie oben bereits angedeutet ist Avilamycin A, eine der 
30 Hauptkomponenten, aus Zuckern aufgebaut. Einzelkomponenten sind D- 
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Olivose, 2-Desoxy-D-Evalose, 4-0-Methyl-D-fucose, 2,6-Di-O-Methyl-D- 
mannose, L-Lyxose und Methyl-Eurekanat. In Studien wies Avilamycin A 
ausgezeichnete Aktivitat gegen multiresistente Staphylococcus aureus - 
Stamme auf (Zahner, 1999). Neben den Orthoestern soil der terminate 
5 Dichloroisoeverninsaure-Rest fur die Wirksamkeit essentiell sein (Wright, 
1979). Die DE 1116864 beschreibt wie die US 3,131,126 die Stoffklasse 
der Avilamycine inclusive eines allgemeinen Hinweises auf Derivate sowie 
Herstellung und Wirkung von Avilamycinen. 

10 Ebenfalls zur Gruppe der Orthosomycine gehort Ziracin. Ziracin 
(SCH27899) ist ein Evernimycin und wurde bereits klinisch getestet. 



Sowohl beim Avilamycin A als auch beim Ziracin hat sich in der Praxis 
allerdings gezeigt, dali der therapeutische Einsatz durch die zu geringe 
Hydrophilie beschrankt zu sein scheint. 

25 Gerade fur die Klasse der Orthosomycine und insbesondere fur die 
Avilamycine durfte molekulares Klonieren und Charakterisieren der die 
Biosynthese von Avilamycin A bestimmenden Enzyme von groRem 
Interesse sein, da diese Information die Richtung fur die Entwicklung 
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neuer (antimikrobieller) Antibiotika vorgeben konnte. Die Gene sind ein 
interessantes System, urn die Bildung und Verknupfung ungewohnlicher 
Desoxyzucker zu studieren und damit unter Umstanden fur eine 
kombinatorische Biosynthese von gro&em Wert. 

5 

Vorherige Arbeit am biosynthetischen Gencluster von Avilamycinen fuhrte 
zur Entschlusselung der Sequenz eines NDP-Glucose-Synthase-Gens 
(aviD [laufende Nr. 53 gemaR Tabelle 1]), eines NDP-Glucose-4,6- 
Dehydratase-Gens (aviE1 [laufende Nr. 54 gemaB Tabelle 1]) und eines 

10 Polyketid-Synthase-Gens (aviM (laufende Nr. 52 gemaB Tabelle 1]). Diese 
haben vermutlich eine Funktion als Teil einer iterativen Typ I Polyketid- 
Synthase zur Bildung von Orsellinsaure, einem Zwischenprodukt in der 
Biosynthese von Dichloroisoeverninsaure. Die Expression von aviM in S. 
IMdans fuhrte zur Bildung von Orsellinsaure [Gaisser, S., Trefzer, A., 

is Stockert, S., Kirschning, A., & Bechthold, A. (1997), J Bacteriol. 179, 
6271-6278]. 

Neben dem Auffinden und Identifizieren geeigneter Enzymsysteme und 
Synthesewege war es daher Aufgabe der Erfindung, neue Antibiotika zur 
20 Verfugung zu stellen, insbesondere auch solche, die eine verbesserte 
Hydrophilie aufweisen. 

Clberraschenderweise stellte sich heraus, daR bestimmte, im Stand der 
Technik nicht vorbeschriebene Avilamycin-Derivate (erfindungsgemaB 

25 auch als Gavibamycine bezeichnet) - insbesondere mit einem in 
entscheidenden Bereichen gegenuber dem Avilamycin A veranderten 
Substitutionsmuster - diese Aufgabe losen konnen und sowohl 
antibiotische Wirkung als auch verbesserte Hydrophilie zeigen. Ein 
Gegenstand der Erfindung ist daher ein Avilamycin-Derivat gemaB 

30 allgemeiner Formel I, auch in Form seiner Diastereomere Oder 
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Enantiomere bzw. razemischer oder anderer <3emische oder reiner 
Diastereomere und/oder Enantiomere, 




I 

20 

, worin unabhangig voneinander mit unten folgender Ausnahme 

R1 ausgewahlt ist aus H, COCH3, COC 4 H 9l COCH(CH 3 ) 2 oder 
COCH2CH3, 

25 

R2 ausgewahlt ist aus H, CHO, COCH3 oder CH(OH)CH 3 , 
R3 OCH3 entspricht, 
30 R4 CI entspricht, 



R5 CI entspricht, 

R6 CH 3 entspricht, 

R7 H f CH 3 Oder CH 2 OH entspricht, 

R8 CH 3 entspricht 

und 

R9 CH 3 entspricht, 

worin in Bezug auf mindestens einen der Reste R3-R6, R8 Oder R9 in 
Formel I abweichend von der voranstehenden Definition folgendes gilt: 

R3 ist durch OH zu ersetzen, 

R4 ist durch H zu ersetzen, 

R5 ist durch H zu ersetzen, 

R6 ist durch H zu ersetzen, 

R8 ist durch H zu ersetzen 

und/oder 

R9 ist durch H zu ersetzen, 
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mit der MaBgabe, dafJ R1-R9 nicht gleichzeitig die Bedeutungen 
gemaS der jeweiligen Kombination in einer der Verbindungen 1-4 
annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


1 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


2 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


H 


CH 3 


CH 3 


CH 3 


CH 3 


3 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


4 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 



Dabei ist unter dem Ausdruck „mit unten folgender Ausnahme" zu 
verstehen, daB es Ausnahmen von den diesem Ausdruck unmittelbar 
folgenden generellen Definitionen der Reste R1-R9 gibt, die mit der 
10 Phrase „worin in Bezug auf mindestens einen der Reste R3-R6, R8 oder 
R9 in Formel I abweichend von der voranstehenden Definition folgendes 
gilt" eingeleitet werden. 

Die erfindungsgemaRen Avilamycin-Derivate zeichnen sich insgesamt 
is neben ihrer uberraschend starken antibiotischen Aktivitat insbesondere 
gegen Staphylococcus aureus, insbesondere auch durch eine gegenuber 
den bekannten Orthosomycinen wie Avilamycin A oder C sowie 
Evernimycin (=Everninomycin, =Evernimicin) deutlich verbesserten 
Hydrophilie aus. Gerade diese erhohte Hydrophilie macht diese 
20 Verbindungen aber zu attraktiven, insbesondere antibiotischen 
Wirkstoffen, da eine erhohte Hydrophilie in bestimmten therapeutischen 
Anwendungen sehr erwunscht ist. AuBerdem gilt fur dieses wie fur alle - 
auch folgend beschriebenen - erfindungsgemalien Avilamycin-Derivate, 
dafc es eine Struktur aufweist, die sich einer klassischen organischen 
25 Synthese nur mit groSer Muhe erschlieBt. Der hier zugrundeliegende 
Einsatz einer gentechnologischen Biosynthese zur Herstellung der 
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erfindungsgemaBen Avilamycin-Derivate erschlieBt damit veranderte, 
neue und bisher nicht zugangliche Wirkstoffe, insbesondere Antibiotika. 

Bevorzugt ist im Rahmen dieser Erfindung ein erfindungsgemaBes 



5 Avilamycin-Derivat, in dem mindestens R3 durch OH zu ersetzen ist, mit 
der MaBgabe, daB R1-R9 nicht gleichzeitig die Bedeutungen gemaB der 
Kombination in der Verbindung 1 annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


1 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


CI 


CH 3 


CH 3 


CH 3 


CH 3 



Ebenfalls bevorzugt ist ein erfindungsgemaBes Avilamycin-Derivat, in dem 
10 mindestens R4 und R5 in Formel I durch H zu ersetzen sind. 

Ebenfalls bevorzugt ist ein erfindungsgemaBes Avilamycin-Derivat, in dem 
mindestens R6, R8 und/oder R9 durch H zu ersetzen ist/sind, mit der 
MaBgabe, daB R1-R9 nicht gleichzeitig die Bedeutungen gemaB der 
15 Kombination in der Verbindung 3 oder nicht gleichzeitig die Bedeutungen 
gemaB der Kombination in der Verbindung 4 annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


3 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


4 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 



Besonders bevorzugt ist es weiter, diese Merkmale zu kombinieren, was 
20 zu einem erfindungsgemaSen Avilamycin-Derivat fuhrt, in dem zum einen 
mindestens R3 durch OH zu ersetzen ist und zum anderen mindestens R4 
und R5 durch H zu ersetzen sind oder mindestens R6, R8 und/oder R9 
durch H zu ersetzen ist/sind. 

25 Ein besonders bevorzugter Gegenstand der Erfindung, der die Aufgabe in 
besonders gunstiger Weise lost, ist dabei ein Avilamycin-Derivat gemaB 
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allgemeiner Formel I, das ausgewahlt ist aus Verbindungen, in denen R1- 
R9 jeweils die in folgender Tabelle angegebene Bedeutung haben, wie 
folgt kombiniert sind: 



R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


COCH(CH3)2 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH2CH3 


H 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


cocHa 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


H 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COC4H9 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH2CH3 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


CH 3 


CH 2 OH 


CH 3 


CH 3 


CDCH(CH 3 ) 2 


CHO 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


CH 3 


H 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 




COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


H 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


H 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COC4H9 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 2 OH 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CHO 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


H 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


H 


CH 3 




COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


H 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH3 


COCH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


H 


COCH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 
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COCH 3 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


CI 


H 


CH 3 


CH 3 


CH 3 
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COCH 3 
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CH 3 


CH 3 


CH 3 
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H 
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CH 3 
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CH 3 
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CH 3 


CH 3 


CH 3 
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CH 2 OH 


CH 3 


CH 3 


COCH(CH 3 ) 2 
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OH 


CI 


CI 
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Die Aufgabe wird auch durch Avilamycin-Derivate gelost, die durch ein 
besonderes Verfahren, das gentechnologische Manipulationen und 
Biosynthese beinhaltet, herstellbar ist. Ein weiterer Gegenstand der 
Erfindung ist daher ein Avilamycin-Derivat, das dadurch erhaltiich ist, dali 
10 in einer kultivierbaren Zelle, die die notigen Gene bzw. Enzyme zur 
Synthese eines Orthosomycin-Grundkorpers bestehend aus 
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(a) einem endstandigen Dichloroisoeverninsaure-Rest (A in 
Formel I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
5 Orthoesterbindungen verknupften Heptasaccharid (B bis H 

in Formel I) aus: 



(i) zwei D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 
10 (iii) einem D-Fucose-Rest (E), 

(iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-)Eurekanat Rest (H) 

is aufweist, mindestens eine Nukleinsaure, deren Sequenz zu 

mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaB einer der Abbildungen 1 bis 54 
entspricht, gentechnologisch verandert, deletiert und/oder nicht 
exprimiert wird, die so modifizierte Zelle kultiviert wird, der 

20 Kulturuberstand gewonnen und aufgearbeitet wird, das oder die 

Avilamycin-Derivat/e aufgereinigt und isoliert wird/werden und 
gegebenenfalls verschiedene Derivate getrennt werden, 



mit der MaBgabe, daB R1-R9 nicht gleichzeitig die Bedeutungen 
25 gemaB der jeweiligen Kombination in einer der Verbindungen 1-16 

annehmen konnen: 
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Dabei versteht man im Sinne der Erfindung darunter, dad „ die Zelle die 
notigen Gene bzw. Enzyme zur Synthese eines Orthosomvcin- 
Grundkorpers aufweist ", daB in der Zelle die fur die notwendigen Enzyme 

5 kodierenden Gene und/oder die funktionsfahigen Enzyme selbst 
vorhanden sind, die fur die Synthese eines „Orthosomycin-Grundk6rpers" 
aus den ublicherweise vorhandenen Vorstufen notig sind. Beispiele waren 
das erfindungsgema&e Gencluster gemali Abb. 109 oder die „Open 
Reading Frames" (ORF) bzw. Gene gemaB laufender Nummer 1-54 

10 gemaS Tabelle 1 i.V.m. Abb. 1 bzw. die zugehorigen Enzyme bzw. 
Proteine gemaB laufender Nummer 55-108 gemafc Tabelle 1 i.V.m. Abb. 
1. 

Die Definition des „ Orthosomycin-Grundk6rpers " ist bereits angegeben, 
15 wobei die Anordnung der Ortho- und der normalen Esterbindung der 
Formel I zu entnehmen ist. Einen solchen Grundkorper weisen unter 
anderem Avilamycine und Evernimycine sowie erfindungsgemalie 
Avilamycin-Derivate auf (s. Formel I). 

20 Weiter versteht man im Sinne dieser Erfindung unter Gen einen Abschnitt 
der DNA, von dem ein einzelnes mRNA-Molekul (das dann in ein 
einzelnes Polypeptid oder Protein translatiert wird) oder ein funktionelles 
RNA-Moleku! (rRNA, tRNA) transkribiert wird. 
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Im Sinne dieser Erfindung versteht man weiter unter . Open Reading 
Frame " (ORF) einen DNA-Abschnitt, der mit einem Start-Codon beginnt, 
mit einem End-Codon endet und eine ununterbrochene Folge von Codons 
5 fiir Aminosauren enthalt. Der Begriff .. Open Reading Frame " (ORF) wird 
hier zur Beschreibung eines klonierten und sequenzierten DNA-Abschnitts 
verwendet, der einem Gen entspricht. 

Unter Codon versteht man die kodierende genetische Grundeinheit. Sie 
besteht aus einem Triplett von drei konsekutiven Nukleotiden, die 
entweder fur eine Aminosaure oder den Beginn oder das Ende einer 
Polypeptidkette kodieren. 

Weiter sind im Sinne dieser Erfindung unter kultivierbaren Zellen Zellen zu 
verstehen, die in-vitro in festem oder flussigem Medium ernahrt durch eine 
flussige oder verfestigte Nahrlosung, dem Kulturmedium, wachsen und 
sich vermehren. Im engeren Sinne sind dies insbesondere Zellen von 
Mikroorganismen oder leicht transfizierbare Zellen, in denen 
entsprechende Gene zur Expression gebracht werden konnen. Es konnen 
dies beispielsweise grampositive und gramnegative Bakterienzellen, wie 
z.B. Streptomyces-Zellen (z.B. Streptomyces viridochromogenes Tu 57), 
aber eben auch Systeme wie Saugetierzellen, z.B. CHO-Zellen (Chinese 
Hamster Ovary), oder immortalisierte Zellinien, z.B. HeLa- oder HEK- 
Zellen, aber auch Insekten-, Fisch-, Amphibien-, Pilze- oder Hefezellen 
etc. sein. 

Unter einer Nukleinsaure versteht man im Sinne dieser Erfindung die 
Grundeinheit von DNA und RNA und damit insbesondere auch die 
Grundeinheit eines Gens und eines ORF. Entsprechend kann eine 
30 Nukleinsaure ein Gen bzw. einen ORF umfassen und eine bestimmte 
Nukleinsauresequenz (die Abfolge der Basen auf dem Phosphat-Zucker- 




20 
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Ruckgrat einer Nukleinsaure) entsprechend ein Gen bzw. einen ORF 
definieren. Unter Nukleinsaure werden auch Sequenzen verstanden, die 
neben den kodierenden Bereichen auch weitere Sequenzbereiche, 
insbesondere am 5- oder am 3-Ende des kodierenden Bereichs, 

5 enthalten. Diese Sequenzen konnen funktionslos sein oder aber 
Promotor- oder Enhancer-Signale, bevorzugt bakterielle bzw. dem zur 
Expression herangezogenen Wirtszellsystem entsprechende Signale, 
sein. Ganz besonders bevorzugt sind neben den fur die 
erfindungsgema&en Proteine kodierenden Sequenzbereichen solche 

10 Nukleotidsequenzen, die fur sog. „Tags" codieren (bspw. His- oder Flag- 
Tag), so dafc die in den Wirtszellen exprimierten erfindungsgema&en 
Proteine bspw. uber Affinitatschromatographie ohne weiteres gereinigt 
werden konnen. An erfindungsgemafce kodierende Nukleotidsequenzen 
konnen damit beliebige Sequenzen vorzugsweise am 5' oder 3'-Ende 

15 angehangt werden, die fur AS-Sequenzen codieren, die einen Tag (bspw. 
ein Antigen) zur Bindung an einen Antikorper bspw. auf einer Saule 
enthalten. Mitoffenbart sind damit auch die AS-Sequenzen, die sich aus 
der Kombination von kodierenden erfindungsgema&en Nukleinsauren mit 
anderen Nukleotidsequenzen ergeben. 

20 

Unter qentechnologisch ist im Sinne der Erfindung der Einsatz 
verschiedener Techniken zu verstehen, mit der DNA in eine Wirtszelle 
eingebracht wird bzw. DNA einer Zelle spezifisch verandert wird. Darunter 
fallt z.B. der Einsatz von Klonierungstechniken, Vektoren, 
25 Restriktionsenzymen etc.. 

Entsprechend hei&t qentechnologisch verandert . daB ein Eingriff die 
Basenfolge, die Sequenz, der Nukleinsaure verandert hat, insbesondere 
die Basensequenz verkurzt (bis hin zur Deletion) oder Mutationen 
30 eingebaut wurden, meist mit der Folge, daB die Nukleinsaure (das Gen) 
nicht oder nur noch verandert in eine mRNA transkribiert werden kann. 
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Deletiert heiSt in diesem Falle, daB eine Nukleinsaure, die hier meist ein 
Gen oder einen ORF umfa&t, ganz oder zumindest weitgehend aus der 
DNA entfernt wird, so daB die Nukleinsaure (das Gen) nicht oder nur noch 
verandert in eine mRNA transkribiert werden kann. Nicht exprimiert 
5 bedeutet entsprechend, daR die Nukleinsaure so verandert wurde, daft die 
Nukleinsaure (das Gen) nicht oder nur noch verandert in eine mRNA 
transkribiert werden kann und entsprechend nicht mehr durch Translation 
das Polypeptid bzw. Protein entsteht, fur das die Nukleinsaure (das Gen 
oder der ORF) ursprtinglich kodiert hat. 

) 10 

Unter mafcig stringenten Hybridisierungsbedingungen werden je nach der 
verwendeten Nukleinsaure-Sequenz (Oligonukleotid, langeres Fragment 
oder vollstandige Sequenz) bzw. je nachdem, welche Nukleinsaureart 
(DNA oder RNA) fur die Hybridisierung verwendet werden, variierende 

is Standardbedingungen verstanden. So liegen beispielsweise die 
Schmelztemperaturen fur DNA:DNA-Hybride ca. 10 °C niedriger als die 
von DNA:RNA-Hybriden gleicher Lange. Unter Standardbedingungen sind 
beispielsweise, je nach Nukleinsaure, Temperaturen zwischen 42 und 58 
°C in einer wafcrigen Pufferlosung mit einer Konzentration zwischen 0,1 

20 bis 5 x SSC (1 X SSC = 0,15 M NaCI, 15 mM Natriumcitrat, pH 7,2) oder 
j zusatzlich in Gegenwart von 50% Formamid, wie beispielsweise 42 °C in 5 

x SSC, 50% Formamid, zu verstehen. Vorteilhafterweise liegen die 
Hybridisierungsbedingungen fur DNA:DNA-Hybride bei 0,1 x SSC und 
Temperaturen zwischen etwa 20 °C bis 45 °C, bevorzugt zwischen etwa 

25 30 °C bis 45 °C. Fur DNArRNA-Hybride liegen die 
Hybridisierungsbedingungen vorteilhaft bei 0,1 x SSC und Temperaturen 
zwischen etwa 30 °C bis 55 °C, bevorzugt zwischen etwa 45 °C bis 55 °C. 
Diese angegebenen Temperaturen fur die Hybridisierung sind beispielhaft 
kalkulierte Schmelztemperaturwerte fur eine Nukleinsaure mit einer Lange 

30 von ca. 100 Nukleotiden und einem G + C-Gehalt von 50 % in 
Abwesenheit von Formamid. Die experimentellen Bedingungen fur die 
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DNA-Hybridisierung sind in einschlagigen Lehrbuchern der Genetik, wie 
beispielsweise bei Sambrook et al. ("Molecular Cloning", Cold Spring 
Harbor Laboratory, 1989), beschrieben und lassen sich nach dem 
Fachmann bekannten Formeln, beispielsweise abhangig von der Lange 

5 der Nukleinsauren, der Art der Hybride Oder dem G + C-Gehalt 
berechnen. Weitere Informationen zur Hybridisierung kann der Fachmann 
folgenden Lehrbuchern entnehmen: Ausubel et al. (eds), 1985, Current 
Protocols in Molecular Biology, John Wiley & Sons, New York; Hames and 
Higgins (eds), 1985, Nucleic Acids Hybridization: A Practical Approach, 

10 IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, Essential 
Molecular Biology: A Practical Approach, IRL Press at Oxford University 
Press, Oxford. 

Unter Kultivierung ist im Sinne dieser Erfindung die in-vitro Zucht von 
15 kultivierbaren Zellen zu verstehen, wodurch diese in festem oder 
flussigem Medium ernahrt durch eine flussige oder verfestigte Nahrlosung, 
dem Kulturmedium, wachsen und sich vermehren. 

Dabei versteht man unter Kulturuberstand das flussige Kulturmedium, das 
20 neben den Nahrstoffen fur die kultivierbaren Zellen auch die von diesen 
nach auRen ins Medium abgegebenen Metaboliten und Substanzen (z.B. 
Avilamycin-Derivate) enthalt. Dieser Kulturuberstand kann gewonnen und 
aufgearbeitet werden, wobei darunter insbesondere das Absaugen des 
Oberstandes und/oder eine Filtration zu verstehen ist, mit der die aus der 
25 Kultivierung und den Zellen ubriggebliebenen Feststoffe abgetrennt 
werden. 

Der Kulturuberstand, der im Rahmen dieser Erfindung meist 
erfindungsgemaSe Avilamycin-Derivate enthalt, kann nach der 
30 Aufarbeitung aufgereinigt werden, wobei darunter beispielsweise eine 
chromatographische Trennung und/oder Trennung uber Flussigphasen 
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bzw. eine Kombination dieser Vorgehensweisen zu verstehen ist. 
Beispiele dafur sind eine Festphasen-Extraktion mit einem Methanol-in- 
Wasser-Gradienten oder eine Ethyl-Acetat-Extraktion. Dabei wird die die 
Avilamycin-Derivate enthaltende Fraktion moglichst weitgehend von 
5 anderen, andere Bestandteile des Kulturiiberstands enthaltenden 
Fraktionen getrennt und damit die Avilamycin-Derivate weitgehend isoliert 
Als alternative Trenn- und/oder Reinigungsverfahren kommen jedoch auch 
die Methode des Aussalzens oder Urn- oder Auskristallisierens in 
Betracht. Gegebenenfalls kann sich dann eine Isolierung und Trennung 
10 der einzelnen Derivate anschliessen, wobei hier insbesondere 
Chromatographiemethoden eingesetzt werden. Ganz besonders 
bevorzugt sind dabei praparative HPLC-Methoden oder auch 
affinitatschromatographische Verfahren. 

15 Es ist bevorzugt, wenn beim Herstellungsverfahren, uber das das 
erfindungsgemafte Avilamycin-Derivat definiert wird, die kultivierbare Zelle 
ausgewahlt ist aus einer Zelle vom Typ Streptomyces viridochromogenes 
oder einer Zelle, die mit Ausnahme der gentechnologisch veranderten, 
deletierten oder nicht exprimierten Nukleinsaure/n die Nukleinsauren 

20 gemaB laufender Nr. 1-54 gemali Tabelle 1 i.V.m. Abb. 1 bzw. dazu zu 
mindestens 95%, vorzugsweise 97 %, homologe Nukleinsauren enthalt 
oder aber mit einer dieser Sequenzen unter maRig stringenten 
Bedingungen hybridisiert oder das Gencluster gemaR Abb. 109 enthalt. 
Unter dem zweiten Punkt der Auswahl sind insbesondere Zellen zu 

25 verstehen, in denen durch gentechnologische Methoden die fur die 
Avilamycin-Derivat-Synthese notwendigen Enzyme exprimiert werden, 
wobei eine der fur ein in den Streptomyces viridochromogenes Tu 57 
endogen vorkommenden Enzym-kodierenden Nukleinsauren 
gentechnologisch verandert oder deletiert ist bzw. nicht exprimiert wird, 

30 insbesondere die Nukleinsaure/DNA gar nicht erst gentechnologisch in die 
Wirtszelle eingebracht wird. Besonders bevorzugt ist es aber, wenn die 
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Zelle ausgewahlt ist aus einer Zelle vom Typ Streptomyces 
viridochromogenes, insbesondere einer Zelle vom Typ Streptomyces 
viridochromogenes Tu 57 bzw. A 23575. 

5 In jedem Falle ist es bevorzugt, wenn bei dem Verfahren die veranderte/n 
(z.B. deletierte/n bzw. nicht in die Wirtszelle eingebrachte/n) 
Nukleinsaure/n fur eine Methyltransferase und/oder fur eine Halogenase 
kodierte/n. 

10 Alternativ kann die Herstellung auch auSerhalb eines in-vivo-Verfahrens 
als in-vitro-Synthese erfolgen. Hierbei werden die fur die Synthese 
erforderlichen Enzyme und/oder Enzymsysteme in mindestens einem 
Versuchsansatz vorgegeben, wobei vorzugsweise in mehreren 
hintereinander geschalteten Versuchsansatzen die fur die Synthese 

15 erforderlichen Reaktionsschritte katalytisch von den erforderlichen und 
erfindungsgemaSen Enzymen durchgefuhrt werden. Ggf. konnen 
zwischen die in entsprechend geeigneter Reihenfolge durchgefuhrten 
Einzelreaktionen Trenn- und/oder Reinigungsschritte zur Aufreinigung der 
jeweils erwunschten Zwischenprodukte eingefugt werden. 

20 

Dabei versteht man unter Methvltransferasen Enzyme, die eine 
Methylgruppe auf ein organisches Molekul ubertragen konnen. 
Insbesondere sind dies im Sinne der Erfindung Enzyme, die entweder auf 
die Orsellinsaure oder auf die Zucker, vorzugsweisde nach Bildung des 
25 Heptasaccharids, eine Methylgruppe ubertragen, insbesondere die ORF's 
aviG2, aviG3, aviG5, aviG6, aviG1, aviG4, aviRa und aviRb, insbesondere 
aviG4. 

Unter Halogenasen versteht man Enzyme, die enzymatisch Halogene auf 
organische Molekule ubertragen konnen. Insbesondere sind dies im Sinne 
30 der Erfindung Enzyme, die auf die Orsellinsaure ein, vorzugsweise zwei 
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Cl-Reste an den Positionen R4 und/oder R5 ubertragen, insbesondere der 
ORF aviH. 

Entsprechend ist es ein besonders bevorzugter Gegenstand der 
5 Erfindung, wenn in Bezug auf das oben genannte Herstellungsverfahren 
die Sequenz/en der veranderte/n Nukleinsaure/n vor der Veranderung zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der/den 
Nukleinsauresequenz/en mindestens einer der Sequenzen gemaB 
laufender Nr. 1 oder 2-7 gemaB Tabelle 1 i.V.m. Abb. 1, vorzugsweise 
10 einer der Sequenzen mit laufender Nr. 1, 2, 4 oder 6 (Tabelle 1 i.V.m. Abb. 
1) entspricht/en, insbesondere der Sequenz mit laufender Nr. 2 oder den 
Sequenzen mit den laufenden Nr. 2 und Nr. 1, Nr. 2 und Nr. 4 oder Nr. 2 
und Nr. 6 (gemaB Tabelle 1 i.V.m. Abb. 1) entspricht oder aber mit einer 
dieser Sequenzen unter ma&ig stringenten Bedingungen hybridisiert. 

15 

Dabei bedeutet M vor der Veranderung " im Sinne dieser Erfindung, daS die 
veranderte Nukleinsaure vor der gentechnologischen Manipulation an ihr, 
d.h. vor der Deletion oder der Veranderung, insbesondere Verkurzung 
oder Mutation in der Basensequenz, aber auch vor dem Schritt, diese 
20 Nukleinsaure/DNA gar nicht erst gentechnologisch in die Wirtszelle 
einzubringen, die genannte Nukleinsauresequenz aufweist. 

Weiter ist es bevorzugt, wenn in dem die Avilamycin-Derivate 
definierenden Herstellungsverfahren die Veranderung der Nukleinsaure/n 
25 dazu fuhrt, daR das oder die durch die gentechnolgisch veranderte/n 
Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
gentechnologischen Veranderung nicht mehr synthetisiert wird/werden. 

Dabei versteht man unter Polypeptid ein Peptid mit zwischen 10 < und < 
30 100 Aminosaureresten und unter einem Protein ein Makromolekul mit 
mehr als 100 uber Peptidbindungen verknupften Aminosaureresten. Dabei 
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sind die Proteine im Zusammenhang mit dieser Erfindung vorzugsweise 
Enzyme. Es fallen aber naturlich auch andere Proteine im Sinne dieser 
Erfindung unter diesen Begriff. 

5 Die bisher beschriebenen erfindungsgemaSen Avilamycin-Derivate haben 
uberwiegend bzw. alle gegenuber im Stand der Technik beschriebenen 
verwandten Orthosomycine, insbesondere gegenuber Avilamycin A, den 
Vorteil, hydrophiler zu sein, was therapeutisch erhebliche Vorteile bietet. 
Das gilt insbesondere fur einen Vergleich mit dem Avilamycin A oder C 

10 bzw. auch mit dem Evernimycin Ziracin. 

Eine Aufgabe der Erfindung war es auch - neben der Bereitstellung neuer 
Antibiotika - die Biosynthese des Avilamycins A aufzuklaren, um darauf 
basierend neue antimikrobielle Substanzen bzw. neue Verfahren zu deren 

is Herstellung zu entwickeln. Ein Kernpunkt war dabei die molekulare 
Klonierung und die Charakterisierung der an der Avilamycin-Biosynthese 
beteiligten Gene. Es wurde ein ca. 60 kB groBes Stuck um die bekannten 
Gene aviD, aviE1 und aviM sequenziert. Dabei stellte sich heraus, daft die 
beteiligten Gene in unmittelbarer Nahe voneinander in einem Cluster 

20 angeordnet waren. Die Sequenz der einzelnen ORF's sowie deren 
Anordnung auf dem zentralen Gencluster (laufenden Nr. Ibis 54) sind in 
Abb. 1 in Verbindung mit Tabelle 1, respektive Abb. 109, dargestellt. Wie 
bereits ausgefuhrt waren die Sequenz eines NDP-Glucose-Synthase- 
Gens (aviD [laufende Nr. 53 gemaB Tabelle 1 i.V.m. Abb. 1]), eines NDP- 

25 Glucose-4,6-Dehydratase-Gens (aviE1 [laufende Nr. 54 gemaft Tabelle 1 
i.V.m. Abb. 1]) und eines Polyketid-Synthase-Gens (aviM [laufende Nr. 52 
gemaS Tabelle 1 i.V.m. Abb. 1]) ebenso bekannt wie deren vermutliche 
Funktion als Teil einer iterativen Typ I Polyketid-Synthase zur Bildung von 
Orsellinsaure, einem Zwischenprodukt in der Biosynthese von 

30 Dichloroisoeverninsaure [Gaisser, S., Trefzer, A., Stockert, S., Kirschning, 
A., & Bechthold, A. (1997), J Bacteriol. 179, 6271-6278]. 
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Die durch die umfangreiche Klonierung entdeckten Sequenzen der an der 
Synthese der Avilamycine beteiligten ubrigen ORF's sind ebenfalls der 
Abb. 1 zu entnehmen wie auch die relative Anordnung auf dem Gencluster 

5 der Abb. 109. Hierbei erlaubt die Angabe der laufenden Nr. aus Tabelle 1 
die Zuordnung zur namentlichen Bezeichnung der ORFs. Unter der 
namentlichen Bezeichnung sind die Sequenzen Abb. 1 zu entnehmen und 
zwar auf die in der Beschreibung von Abb. 1 dargestellte Weise. Die 
genaue Klonierungsstrategie sowie weitere Einzelheiten der 

10 Sequenzierung sind in den Beispielen dargestellt ebenso wie die 
funktionelle Analyse und Charakterisierung der gefundenen Gene 
(ORF's). Die Zuordnung der ORF-Kurzel zu Funktion und Sequenz (incl. 
abgeleiteter Proteinsequenz) kann der der Abbildungsbeschreibung 
folgenden Tabelle 1 entnommen werden. 

15 

Ein weiterer wichtiger Gegenstand der Erfindung ist daher eine (oder 
mehrere) Nukleinsaure(n), die in ihrer Sequenz zu mindestens 95%, 
vorzugsweise 97%, insbesondere genau, der Nukleinsauresequenz 
gemaB einer der Sequenzen der laufenden Nummer 1 bis 51 gemaB 

20 Tabelle 1 i.V.m. Abb. 1 entspricht/entsprechen oder aber mit einer dieser 
Sequenzen unter ma&ig stringenten Bedingungen hybridisiert. 
Insbesondere werden auch Sequenzen mit den laufenden Nr. 48 und 49 
(gemaB Tabelle 1 und Sequenzdarstellung in Abb. 1) mit Funktion als 
rRNA-Methyltransferasen (aviRa und aviRb) und auch die Sequenzen mit 

25 den laufenden Nr. 50 und 51 (gemaB abelle 1 i.V.m. Abb. 1) mit Funktion 
als ABC-Transporter-Gene (aviABCI und aviABC2), die Resistenzen 
gegen Avilamycine vermitteln, bzw. Sequenzen, die zu mindestens 95% 
diesen Sequenzen mit den vorgenannten laufenden Nr. entsprechen oder 
aber mit einer dieser Sequenzen unter maBig stringenten Bedingungen 

30 hybridisieren, in der vorliegenden Erfindung beschrieben. Im ubrigen auch 
Mischungen von Nukleinsauren, die beliebige Unterkombinationen der 
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gemaB Abb. 1 dargestellten Nukleinsauren mit den laufenden Nr. 1 bis 51 
aus Tabelle 1 darstellen, bspw. Mischungen aus zwei, drei, vier, .... 50 
Nukleinsauren in beliebiger Kombination sind erfindungsgemaB 
mitoffenbart, ggf. auch als Kombination auf einem Nukleinsaurestrang 
5 oder auf verschiedenen Strangen. 

Dabei ist/sind insbesondere (eine) Nukleinsaure/n bevorzugt, die zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaB einer der Sequenzen mit der laufenden Nr. 1 
10 bis 32 gemaB Tabelle 1 (i.V.m. Abb. 1), vorzugsweise 1 bis 7, 
insbesondere 1, 2, 4 oder 6, oder aber einer der Sequenzen mit der 
laufenden Nummer 48 bis 51 oder 43, 44 oder 46 gemaB Tabelle 1 (i.V.m. 
Abb. 1) entspricht/entsprechen oder die aber mit einer dieser Sequenzen 
unter maBig stringenten Bedingungen hybridisiert/en. 

15 

Ein weiterer Gegenstand der Erfindung sind entsprechend auch 
Gencluster, die „Open reading frames", vorzugsweise 54, enthalten, die in 
ihrer Nukleinsauresequenz zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, den Nukleinsauresequenzen gemaB den Sequenzen 

20 mit den laufenden Nummern 1 bis 54 (Tabelle 1 i.V.m. Abb. 1) 
entsprechen oder aber mit einer dieser Sequenzen unter maBig 
stringenten Bedingungen hybridisiert und die auf einem 
Nukleinsaurestrang oder in beliebiger Kombination auf dem einem oder 
dem anderen Strang angeordnet sind, vorzugsweise gemaB Abb. 109. 

25 Die Gene in einem erfindungsgemaBen Gencluster konnen 2, drei, vier, ... 
, 54 erfindungsgemaBe Gene, ggf. in Kombination mit den bereits 
bekannten genen, in beliebiger Strangverteilung und Unterkombination 
enthalten, insbesondere konnen die zwischen den ORFs liegenden 
Abschnitte beliebiger Nukleotidsequenz sein. 
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Damit ist insbesondere ein Gencluster gemaS Abb. 109 gemeint, aber 
auch Gencluster, die entsprechende Nukleinsauren, evt. auch in anderer 
Anordnung enthalten, wobei bevorzugt - aber nicht notwendig - ist, daB 
alle ORFs gemaG den laufenden Nummern 1-54 (Tabelle 1 i.V.m. Abb. 1) 
5 im Gencluster zu finden sind. 

Unter dem Begriff Gencluster versteht man im Sinne dieser Erfindung ein 
Abschnitt einer DNA, auf dem sich in enger raumlicher Nachbarschaft 
mehrere Gene befinden. Derartige erfindungsgema&e Gencluster konnen 
in einem Vektor vorliegen, bspw. einem BAC Oder YAC, einem Cosmid 
oder Plasmid. Vektoren, die mindestens eine erfindungsgema&e Sequenz 
enthalten, sind damit gleichfalls Gegenstand der vorliegenden Erfindung. 
Erfindungsgemafte Gene konnen in erfindungsgemalien Vektoren mit 
weiteren Signalsequenzen oder weiteren Genen, insbesondere weiteren 
Antibiotika-Resistenz-Genen, kombiniert werden. 

Aus den neu entdeckten Sequenzen der ORF's bzw. Gene lieBen sich 
Protein- und Polypeptidsequenzen ableiten. Entsprechend ist ein weiterer 
Gegenstand der Erfindung ein Protein oder Polypeptid, das in seiner 
20 Aminosauresequenz zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der Aminosauresequenz gemaB einer der 
Sequenzen mit den laufenden Nr. 55-101 (Tabelle 1 i.V.m. Abb. 1) 
entspricht. 

25 Dabei ist es bevorzugt, wenn das erfindungsgemaRe Protein oder 
Polypeptid zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
der Nukleinsauresequenz gemaB einer der Sequenzen mit den laufenden 
Nr. 55 bis 86 oder 97, 98 oder 100 oder 102 bis 105 (Tabelle 1 i.V.m. Abb. 
1), vorzugsweise 55 bis 61, insbesondere 55, 56, 58 oder 60, entspricht. 
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Ein weiterer Gegenstand ist entsprechend auch ein Protein oder 
Polypeptid, das durch eine Nukleinsaure gemaS einem der Anspruche 12 
oder 13 kodiert wird. Dabei versteht man unter ,,kodieren" im Sinne dieser 
Erfindung, daB die Codons (s.o.) des entsprechenden 
5 Nukleinsaureabschnitts (Gen oder ORF) fur die entsprechende 
Aminosauresequenz kodieren, also nach Transkription und Translation ein 
entsprechendes Protein oder Polypeptid mit dieser Aminosauresequenz 
entsteht. 

10 Insbesondere sind die erfindungsgemaBen Proteine Enzyme, bzw. Teil 
eines Multienzymkomplexes. Sie konnen aber naturlich auch andere 
Funktionen haben. 

Da zum einen die erfindungsgemaBen Avilamycin-Derivate uber ein 
15 gentechnologisches bzw. biotechnologisches Verfahren definiert sind oder 
dadurch hergestellt werden, auf der anderen Seite die neu entdeckten 
Gene bzw. Proteine (Enzyme) in gen- bzw. biotechnologischen Verfahren 
zur Herstellung entsprechender Antibiotika eingesetzt werden konnen, 
haben im Rahmen dieser Erfindung nahezu zwangslaufig 
20 gentechnologisch veranderte Zellen eine wichtige Funktion. 

Ein weiterer Gegenstand dieser Erfindung sind daher gentechnologisch 
veranderte Zellen enthaltend mindestens eine nicht-endogene 
erfindungsgemaSe Nukleinsaure, einen nicht-endogenen 
25 erfindungsgemaBen Gencluster und/oder ein nicht-endogenes 
erfindungsgemaBes Protein oder Polypeptid. 

Ebenso ist eine Zelle ein weiterer Gegenstand der Erfindung, die 
mindestens eine gentechnologisch veranderte Nukleinsaure, deren 
30 Sequenz vor der Veranderung zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der Nukleinsauresequenz gemaB einer der 
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Sequenzen mit der laufenden Nr. 1 bis 54 (Tabelle 1 i.V.m. Abb.1) 
entsprach Oder aber die mit einer dieser Sequenzen unter maBig 
stringenten Bedingungen hybridisierte, enthalt. 

5 Ein besonders bevorzugter Gegenstand der Erfindung ist eine Zelle vom 
Typ Streptomyces viridochromogenes, vorzugsweise vom Subtyp T057, 
bei dem mindestens eine der Nukleinsauren mit einer Sequenz mit einer 
der laufenden Nr. 1-54 (Tabelle 1 i.V.m. Abb. 1) gentechnologisch 
verandert oder deletiert wurde. Dabei ist es besonders bevorzugt, wenn in 

10 der entsprechenden Zelle mindestens eine der Nukleinsauren mit einer 
Sequenz mit laufender Nr. 1 oder 2-7 (Tabelle 1 i.V.m. Abb. 1), 
vorzugsweise mit einer der Sequenzen mit laufender Nr. 1, 2, 4 oder 6 
(Tabelle 1 i.V.m. Abb. 1), insbesondere mit einer Sequenz mit laufender 
Nr. 2 oder mit Sequenzen mit den laufenden Nr. 2 und Nr. 1, Nr. 2 und Nr. 

15 4 oder Nr. 2 und Nr. 6 (gemaB Tabelle 1 i.V.m. Abb. 1) gentechnologisch 
verandert oder deletiert wurde. 

Ebenfalls besonders bevorzugt ist es, wenn die Zelle vom Mutanten-Typ 
Streptomyces viridochromogenes GW4, Streptomyces viridochromogenes, 

20 GW4-AM1, Streptomyces viridochromogenes GW2 oder Streptomyces 
viridochromogenes GW5 ist, wobei vom Mutanten-Typ Streptomyces 
viridochromogenes GW4 Avilamycin-Derivate synthetisiert werden, in 
denen R3 = OH ist, vom Mutanten-Typ Streptomyces viridochromogenes 
GW4-AM1 Avilamycin-Derivate synthetisiert werden, in denen R3 = OH, 

25 R4 = H und R5 = H sind, vom Mutanten-Typ Streptomyces 
viridochromogenes GW2 Avilamycin-Derivate synthetisiert werden, in 
denen R3 = OH und R6 = H sind und vom Mutanten-Typ Streptomyces 
viridochromogenes GW5 Avilamycin-Derivate synthetisiert werden, in 
denen R3 = OH und R9 = H sind. 
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GemaB obigen Ausfuhrungen ist entsprechend ein weiterer Gegenstand 
der Erfindung die Verwendung einer erfindungsgema&en Nukleinsaure, 
eines erfindungsgemafien Genclusters, eines erfindungsgemaRen 
Proteins oder Polypeptids und/oder einer der erfindungsgemaden Zellen 
zur Herstellung eines Avilamycin-Derivats, vorzugsweise eines 
erfindungsgema&en Avilamycin-Derivats. 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung 
erfindungsgemafcer Avilamycin-Derivate mit folgenden Schritten: 

(1) in einer kultivierbaren Zelle, die die notigen Gene bzw. Enzyme 
zur Synthese des Orthosomycin-Grundkorpers bestehend aus 

(a) einem endstandigen Dichloroisoeverninsaure-Rest (A in 
Formel I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 
in Formel I) aus: 

(i) zwei D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose-Rest (E), 

(iv) einem D-Mannose-Rest (F) f 

(v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-)Eurekanat Rest (H) 

aufweist, wird mindestens eine Nukleinsaure, deren Sequenz 
zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
der Nukleinsauresequenz mit einer der laufenden Nr. 1 bis 54 
gemali Tabelle 1 i.V.m. Abb. 1 entspricht oder aber eine 
Nukleinsaure, die mit einer dieser Sequenzen unter ma&ig 
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stringenten Bedingungen hybridisiert, gentechnologisch 
verandert, deletiert oder nicht exprimiert, 

(2) die so gentechnologisch veranderte Zelle wird kultiviert, 
5 (3) der Kulturuberstand wird gewonnen, 

(4) der Kulturuberstand wird aufgearbeitet und dabei das oder die 
entstandene/n Avilamycin-Derivat/e aufgereinigt und isoliert, 

(5) gegebenenfalls werden unterschiedliche Derivate getrennt. 

io Es ist bevorzugt, wenn bei diesem Verfahren die kultivierbare Zelle 
ausgewahlt ist aus einer Zelle vom Typ Streptomyces viridochromogenes 
oder einer Zelle, die mit Ausnahme der gentechnologisch veranderten, 
deletierten oder nicht exprimierten Nukleinsaure die Nukleinsauren gemaB 
laufenden Nr. 1-54 gemaR Tabelle 1 i.V.m. Abb. 1 bzw. dazu zu 

is mindestens 95%, vorzugsweise 97 %, homologe Nukleinsauren oder aber 
mit diesen Sequenzen hybridisierende Sequenzen enthalt oder den 
erfindungsgerna&en Gencluster enthalt. Letzteres wird in der Fachliteratur 
als heterologe Expression bezeichnet. Dabei ist es besonders bevorzugt, 
wenn die Zelle ausgewahlt ist aus einer Zelle vom Typ Streptomyces 

20 viridochromogenes, Streptomyces lividans, Streptomyces albus oder 
Streptomyces fradiae, insbesondere einer Zelle vom Typ Streptomyces 
viridochromogenes Tu 57 oder A 23575. 

Auch eine alternative Verfahrensfuhrung kommt erfindungsgemaB in 
25 Betracht. Hierbei wird nach Durchfuhrung der Verfahrensschritte (1) und 
(2) jedoch das Avilamycin-Derivat nicht aus dem Kulturuberstand 
gewonnen, sondern dieses akkumuliert sich vielmehr in den Wirtszellen. 
GemaB dem alternativen Verfahren werden daher in Verfahrensschritt (3) 
die Wirtszellen geerntet, nachfolgend aufgeschlossen und die Avilamycin- 
30 Derivate von den ubrigen Zellbestandteilen getrennt und schlieRlich 
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aufgereinigt. Zur Trennung und Aufreinigung konnen die vorgenannten 
und alle dem Fachmann gelauftgen Verfahren zum Einsatz kommen. 

Weiter bevorzugt ist es, wenn bei dem erfindungsgemaBen Verfahren die 
veranderte/n Nukleinsaure/n fur eine Methyltransferase und/oder fur eine 
Halogenase kodiert/en. Dabei ist es besonders bevorzugt, wenn die 
Sequenz/en der veranderte/n Nukleinsaure/n vor der Veranderung zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, der/den 
Nukleinsauresequenz/en mindestens einer der Sequenzen mit den 
laufenden Nr. 1 Oder 2-7 gemaB Tabelle 1 i.V.m. Abb. 1, vorzugsweise 
einer Sequenzen mit den laufender Nr. 1, 2, 4 oder 6 (Tabelle 1 i.V.m. 
Abb. 1), entspricht/en, insbesondere der Sequenz mit laufender Nr. 2 oder 
den Sequenzen mit den laufenden Nr. 2 und Nr. 1, Nr. 2 und Nr. 4 oder 
Nr. 2 und Nr. 6 (gemaB Tabelle 1 i.V.m. Abb. 1). 

Weiter bevorzugt ist es, wenn bei dem erfindungsgemaBen Verfahren die 
Veranderung der Nukleinsaure/n, insbesondere von erfindungsgemaBen 
Methyltransferasen und/oder Halogenasen, dazu fuhrt, daB das oder die 
durch die gentechnolgisch veranderte/n Nukleinsaure/n kodierte/n 
Protein/e oder Polypeptid/e nach der gentechnologischen Veranderung 
nicht mehr synthetisiert wird/werden. 

Die erfindungsgemaBen Avilamycin-Derivate sind prinzipiell toxikologisch 
unbedenklich, so daB sie sich als pharmazeutischer Wirkstoff in 
Arzneimitteln eignen. Ein weiterer Gegenstand der Erfindung sind daher 
Arzneimittel enthaltend mindestens ein erfindungsgemaBes Avilamycin- 
Derivat, vorzugsweise mindestens zwei, insbesondere auch Mischungen 
von einem oder mehreren Avilamycin-Derivaten mit mindestens einem 
weiteren Antibiotikum aus dem Stand der Technik, bspw. Vancomycin, 
Penicillin, Streptomycin, Neomycin, Kanamycin, Sisomycin, Amikacin 
und/oder Tobramycin, sowie gegebenenfalls geeignete Zusatz- und/oder 
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Hilfsstoffe. Auch andere bakteriostatische oder bakterizide Substanzen 
konnen mit erfindungsgemaBen Substanzen kombiniert werden, bspw. 
Cephalosporine, Chloramphenicol, Ethambutol, Cephalosporine, 
Isonicotinamide, Tetracycline, Sulfonamide, Oxalactame (bspw. Flomoxef, 
5 Clavulansaure) und/oder Nitrofurane. 

Darunter versteht man insbesondere auch Tragermaterialien, Fullstoffe, 
Losungsmittel, Verdunnungsmittel, Farbstoffe und/oder Bindemittel. Die 
Arzneimittel konnen als flussige Arzneiformen in Form von 

10 Injektionslosungen, Tropfen oder Saften, als halbfeste Arzneiformen in 
Form von Granulaten, Tabletten, Pellets, Patches, Kapseln, Pflaster oder 
Aerosolen verabreicht werden. Die Auswahl der Hilfsstoffe etc. sowie die 
einzusetzenden Mengen derselben hangen davon ab, ob das Arzneimittel 
oral, peroral, parenteral, intravenos, intraperitoneal, intradermal, 

15 intramuskular, intranasal, buccal, rektal oder ortlich, zum Beispiel auf die 
Haut, die Schleimhaute oder in die Augen, appliziert werden soil. Fur die 
orale Applikation eignen sich Zubereitungen in Form von Tabletten, 
Dragees, Kapseln, Granulaten, Tropfen, Saften und Sirupen, fur die 
parenterale, topische und inhalative Applikation Losungen, Suspensionen, 

20 leicht rekonstituierbare Trockenzubereitungen sowie Sprays. 

Oral oder perkutan anwendbare Zubereitungsformen konnen die 
erfindungsgemaBen Avilamycin-Derivate verzogert freisetzen und so 
einen gleichma&igeren Plasmaspiegel erreichen. Prinzipiell konnen den 
25 erfindungsgemaBen Arzneimitteln andere dem Fachmann bekannte 
weitere Wirkstoffe zugesetzt werden. 

Die an den Patienten zu verabreichende Wirkstoffmenge variiert in 
Abhangigkeit vom Gewicht des Patienten, von der Applikationsart, der 
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Indikation und dem Schweregrad der Erkrankung. Oblicherweise werden 
0,005 bis 1000mg/kg, bevorzugt 0,05 bis 5 mg/kg wenigstens eines 
erfindungsgema&en Avilamycin-Derivats appliziert. 

Da fur die erfindungsgemaBen Avilamycin-Derivate eine antibiotische 
Wirkung nachgewiesen ist, eignen sie sich naturlich prinzipiell zur 
Behandlung von Erkrankungen, insbesondere zur Behandlung von 
Infektionskrankheiten, bzw. zur Herstellung eines Arzneimittels zur 
Behandlung derartiger Erkrankungen. Ein weiterer Gegenstand der 
Erfindung ist entsprechend die Verwendung eines erfindungsgemaSen 
Avilamycin-Derivats zur Herstellung eines Arzneimittels mit antibiotischer 
Wirkung zur Behandlung von bspw. Infektionskrankheiten. Unter 
Infektionserkrankungen werden Erkrankungen verstanden, denen eine 
Infektion mit einem viralen, einem bakteriellen oder einem 
protozoologischen Erreger zugrundeliegt. Damit sind die vorliegenden 
erfindungsgemaSen Antibiotika auch zur Behandlung von Mykosen, 
insbesondere kutanen und subkutanen Mykosen, geeignet. 

Bevorzugt werden die erfindungsgemaBen Avilamycin-Derivate jedoch zur 
Bekampfung bakterieller Infektionen eingesetzt. Insbesondere sind 
Infektionen mit den folgenden Erregern zu nennen: Leprabakterien, 
Mykobakterien, Neisserien, Tuberkulosebakterien, Aktinomyceten, 
Corynebakterien, Listerien, Clostridien, Bazillen, Enterokokken, 
Streptokokken, Staphylokokken, insbesondere auch zur Behandlung von 
Infektionen mit Staphylococcus aureus Stammen, Rickettsien, 
Chlamydien, Mykoplasmen, Borrelien, Spirochaten, Brucellen, 
Bortedellen, Pseudomonaden, Helicobacter, Hemophilus, Vibrionen, 
Shigellen, Yersinia, Salmonellen und weitere unter die Familie der 
Enterobacteriaceae fallende Vertreter. Entsprechend werden die 
erfindungsgemaBen Substanzen zur Behandlung aller klinischen 
Krankheitsbilder, die durch bspw. die vorgenannten Bakterienstamme 
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verursacht werden, verwendet. Beispielhaft seien die folgenden 
Krankheitsbilder genannt: Tuberkulose; Pneumonien; Typhus; Paratyphus; 
Lues; Gastritis; Gastroenteritis; Ruhr; Pest; Enteritis; extraintestinale 
Infekte, Peritonitis und Appendizitis mit E. coli sowie intestinale Infekte mit 
EHEC, EPEC, ETEC oder EIEC; Cholera, Legionarskrankheit, 
Keuchhusten, Brucellosen, Lyme-Borreliose, Leptospirose, Fleckfieber, 
Trachom, Gonorrhoea Meningitis, Septikamie, Lepra etc. 

Ein weiterer Gegenstand des Verfahrens ist auch die Behandlung eines 
Menschen oder Tieres, der oder das diese Behandlung benotigt, mit 
einem erfindungsgema&en Avilamycin-Derivat, vorzugsweise bei 
Infektionskrankheiten, insbesondere unter Beteiligung von Staphylococcus 
aureus. 

Im folgenden Abschnitt wird die Erfindung weiter durch Beispiele erlautert, 
ohne sie darauf zu beschranken. 

Beispiele und Abbildungen: 

Abbildungen: 

Abbildung 1 z eigt die Sequenz des gesamten Genclusters mit seinen 54 
Nukleinsauresequenzen der ORF's aus Streptomyces viridochromogenes 
Tu 57. In Abbildung 1 sind die Kurzbezeichnungen der entsprechenden 
Nukleinsauresequenzen enthalten, wobei diese Kurzbezeichnungen (ohne 
das Prafix „Avi") jeweils an den Zeilen eingefugt sind, die die Startcodons 
der 54 Sequenzen aufweisen. Die AS, die durch das jeweilige Startcodon 
codiert wird, ist eingekreist. Der an diesen Stellen jeweils eingezeichnete 
Pfeil gibt die Leserichtung (ruckwarts oder vorwarts) der Gene mit dem 
Startcodon als Ausgangspunkt wieder. 
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Abb. 1 enthalt die Nukleotidsequenzen der beiden komplementaren DNA- 
Strange ebenso wie die (tw. fiktiven) AS-Sequenzen fur beide Strange in 
alien drei Leserastern, insgesamt also 2 Nukleotidsequenzen und die sich 
hieraus potentiell ergebenden 6 Proteinsequenzen (Ein-Buchstaben- 
Code). Die drei Proteinsequenzen des oberen Nukleotidstrangs sind 
oberhalb der dazugehorigen Nukleotidsequenz, die drei Proteinsequenzen 
des unteren komplementaren Nukleotidsequenz unterhalb des 
dazugehorigen unteren Nukleotidstrangs eingezeichnet. Die 54 namentlich 
in Abb. 1 eingezeichneten Proteinsequenzen im Gencluster ergeben sich 
aus Abb. 1 dadurch, daR eine eingekreiste AS als Ausgangspunkt gewahlt 
wird und dann in diesem Leseraster, d.h. in der entsprechenden Zeile 
(bspw. 2. Zeile unterhalb der unteren Nukleotidsequenz), die AS-Sequenz 
in der durch die Pfeile angegebenen Richtung, also im folgenden 
entweder vorwarts Oder ruckwarts, abgelesen wird. Die Sequenz endet 
mit dem Stop-Codon im entsprechenden Leseraster, wobei Stop-Codons 
durch ein „Stern"-Symbol in der enrsprechenden Zeile markiert sind. 

Die zur AS eines ORFs gehorige Nukleotidsequenz ergibt sich durch das 
20 entsprechende oberhalb Oder unterhalb (fur den oberen Strang) 
befindliche Triplett. Die Ein-Buchstaben-Bezeichnung der Aminosaure ist 
dabei jeweils so angeordnet, daS sie oberhalb oder unterhalb des 
mittleren Nukleotids des fur diese AS kodierenden Codons liegt. 

25 In der nachfolgenden Tabelle sind die namentlichen Bezeichnungen der 
54 kodierenden Bereichen im Gencluster jeweils laufenden Nummern 
zugeordnet, wobei die laufenden Nummern 1 bis 54 die 
Nukleotidsequenzen angeben und die laufenden Nummern 55 bis 108 den 
jeweils dazu gehorigen AS-Sequenzen entsprechen, und zwar codiert die 

30 Nukleotidsequenz mit der laufenden Nummer 1 fur die AS mit der 



10 
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laufenden Nummer 55, die Nukleotidsequenz mit der laufenden Nummer 2 
ftir die AS mit der laufenden Nummer 56 etc.. 

Abbildunq 109 zeigt die relative Anordnung der gefundenen ORF's auf 
5 dem Gencluster. 

Abbildung 110 zeigt einen Southern-Blot mit der Mutante S. 
viridochromogenes GW4. 

10 Abbildung 111 zeigt das Massenspektrum der Produkte von Mutante S. 
viridochromogenes GW4 

Abbildung 112 zeigt das Massenspektrum der hydrolysierten Produkte von 
Mutante S. viridochromogenes GW4. 

15 

Die Zuordnung der ORF-Kurzel zu ihrer Funktion und Sequenz (incl. 
abgeleiteter Proteinsequenz) kann derfolgenden Tabelle 1 entnommen 
werden. 



20 
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Beispiele 
Beispiel 1 

Allgemeine Methoden und Materialien: 
a) 

Bakterienstamme, Plasmide und Kulturbedingunqen. 

Streptomyces viridochromogenes TQ57 wurde mit 1 % Malzextrakt, 0.4 % 
Hefeextrakt, 0.4 % Glucose und 1 mM CaCI 2 , bei einem pH von 7.2 (HA 
medium) bei 37°C kultiviert. Zur Herstellung von Avilamycin A wurden 
Streptomyces viridochromogenes T057 und alle Mutanten in NL19+- 
Medium, das 2% D-Mannitol, 2% Sojamehl und 20 mM L-Valin enthielt 
und auf pH 7.5 eingstellt war, kultiviert. Fur die DNA-Manipulation wurde 
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Escherichia coli XL-1 Blue MRF (Stratagene) als Wirtszelle benutzt. Vor 
der Transformation von S. viridochromogenes TQ57 wurden die Plasmide 
in E . coli ET 12567 (dam~, dcm~, hsdS, Cm R ) angezogen, um 
unmethylierte DNA zu erhalten. E. coli Stamme wurden auf Luria-Bertani 
5 (LB) Agar oder flussigem Medium, das das geeignete Antibiotikum 
enthielt, kultiviert. 



io Allgemeine gentechnologische Manipulationen. PCR und DNA 
Sequenzierung / Sequenz-Analvse 

Es wurden Standard-Methoden der Molekularbiologie - wie dem 
Fachmann bekannt - durchgefuhrt. Die Isolierung von E.coli Plasmid DNA, 

15 DNA Restriktion, DNA Modifizierung wie das „filling-in sticky ends" und die 
„Southern M -Hybridisierung wurden gemaB den Protokollen der Hersteller 
der Kits, Enzyme und Reagentien durchgefuhrt (Amersham-Pharmacia, 
Boehringer Mannheim, Promega, Stratagene). Streptomyces 
Protoplastenbildung, -transformation, und -regenerierung wurden wie 

20 ublich durchgefuhrt. Die PCR wurde mit einem Perkin Elmer GeneAmp 
2400 thermal cycler durchgefuhrt, wobei die Bedingungen so wie 
beschrieben und ublich waren. Die verwendeten Oligonukleotid-Primer 
waren: 



25 AviG4F(5 , -GGACGCCTATCTGTGCCACCCCTTCCTGGT-3 , ), 
AviG4R (5 ^TGAGCGCTCGCCTAGACAGAATCATCTCCCS 1 ), 
S2A (5 , -GCGTCCATCTTGCCGGGA-3 , ) und 
S2B (5 ,-CGTGGATCCCGCCGGCCC-3 , ). 



30 Die Nukleotidsequenzierung wurde mit der Dideoxy- 
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Kettenabbruchsmethode unter Verwendung eines automatischen Laser- 
Fluorescenz-Sequencers (Perkin Elmer ABI) durchgefuhrt. Die 
Sequenzierungs-Reaktionen wurden mit einem Thermosequenase-Cycle- 
Sequencing Kit mit 7-deaza-dGTP (Amersham) und Standard-Primern (M 

5 13 universal and reverse, T3, T7) durchgefuhrt. Mit dem DNASIS- 
Software-Paket (version 2.1, 1995; Hitachi Software Engineering) wurde 
eine computerunterstutzte Sequenz-Analyse und die Datenbank- 
Recherche mit dem BLAST 2.0 program auf dem Server des National 
Center for Biotechnology Information, Bethesda MD, USA, durchgefuhrt. 

10 Die vorgelegten Sequenzen sind in der „GenBank"-Datenbank unter der 
Zugangsnummer (Recession Number") AF333038 abgelegt. 

c) 

Konstruktion eines Gen-inaktivierenden Plasmids 

15 

aviG4: Eine einmal vorkommende A/col-Restriktionsschnittstelle im Gen 
aviG4 (laufende Nr. 2, Abb. 1), die auf dem 1.9 Fragment liegt, das in die 
Sacl und EcoR\ Schnittstellen von pBSK- ligiert ist, wurde fur die gezielte 
Inaktivierung durch ein Verschieben des Leserahmens ausgewahlt. Das 

20 1.9 kb Fragment wurde mit Sacl und Kpn\ verdaut und wurde in das Gen- 
Inaktivierungsplasmid pSP 1 hineinligiert. Nach dem Restriktionsverdau 
mit A/col, Behandlung mit dem Klenow -Fragment der E. coli DNA- 
Polymerase I und erneuter Ligation wurde die beabsichtigte Veranderung 
durch DNA-Sequenzierung bestatigt. Das gebildete Plasmid wurde als 

25 pMIKG4E3 bezeichnet. 

aviH: Die einmal vorkommende Nari Schnittstelle im aw'H-Gen, das auf 
dem 3.7 kb Sacl-Fragment ligiert in pBSK- vorliegt, wurde durch A/ari- 
Restriktionsverdau und anschlieBender Behandlung wie fur aviG4 
30 beschrieben, verandert Die Sequenzierung verschiedener Plasmide 
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zeigte die korrekte Veranderung. Das 3.7 kb-Fragment wurde in pSP1 
kloniert, urn das Gen-lnaktivierungs-Plasmid pSP 1S2Narzu bilden. 

d) 

5 Analyse neuer Avilamycin-Derivate 
DC- Analyse 

Streptomyces viridochromogenes TQ57 und die Mutanten GW-4 und 
GW4-AM1 wurden drei Tage lang inkubiert. Die Kulturen wurden abfiltriert 

10 und das Filtrat auf eine Festphasen Extraktions-Patrone aufgetragen 
(SepPakCis, Waters). Die Patrone wurde mit einem Gradienten zwischen 
10 % und 100% Methanol in Wasser eluiert Avilamycin-Derivate eluieren 
mit der Fraktion, die 60-70 % Methanol enthalt. Nach einer Extraktion mit 
Ethyl-Acetat und Abziehen des Losungsmittels wurden die Avilamycin- 

15 Derivate wieder in Methanol gelost und mittels DC auf Silicagel-Platten 
(silica gel 60 F254, Merck) mit Methylenchlorid/Methanol (9:1, v/v) als 
Losungsmittel gemessen. Avilamycin-Derivate waren nach Behandlung 
mit Anisaldehyd/H 2 S0 4 detektiert worden. 

20 e) 

HPLC-UV-Analyse 

Eine analytische HPLC-UV wurde auf einem Hewlett Packard 1090 Liquid 
Chromatograph mit einem Photodioden-Array-Detektor und einer HP- 
25 ODS-Hypersil 5Mm, 200 x 2 mm Saule durchgefuhrt. Die Abfolge der 
Losungen war wie folgt: Losung A, 0.04M (NH 4 )2HP0 4 pH 7.0 Puffer; 
Losung B, 100% Methanol; ein nichtlinearer Gradient, mit 30-62% der 
Losung B uber 25min bei einer FluSrate von 0.2ml/min verteilt. 
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f) 

HPLC-MS-Analyse 

Fur die HPLC-MS-Analyse wurden die Avilamycin-Derivate auf einer 
HPLC-Anlage (HP 1110, Hewlett-Packard, Waldbronn) mit einer HP ODS 
Hypersil Ci 8 Saule (2.1 by 100 mm; 5 pm) bei einer Fluftrate von 0.1 
ml/min, Detektion bei 220 nm und dem folgenden Gradienten laufen 
gelassen: 0-5 min von 0 % bis 20 % B, 5.1-120 min bis 90 % B (Losung A, 
H 2 0 : MeOH 3:2; Losung B, MeOH). Massenspektren wurden auf einem 
Bruker Esquire-LC 1.6n Massenspektrometer (Bruker Daltonik, Bremen) 
mit einer Elektrospray (ES) lonenquelle (positive ion mode) aufgezeichnet. 
Die MeBbreite betrug zwischen 200 - 1800 m/z. 

9) 

15 GC-MS-Analyse 

Eine Analyse der neuen Gavibamycin-Derivate (erfindungsgemaRen 
Avilamycin-Derivate), die durch die mutierte Zelle Streptomyces 
viridochromogenes GW4 synthetisiert worden waren, wurde nach 

20 Etylierung mit GC-MS-Analyse durchgefuhrt. Die Derivate wurden in einer 
Mischung aus DMSO und Acetonitril (3:40) gelost. Nach Zugabe von 
Ethyliodid und K 2 C0 3 lief die Reaktion uber Nacht ab. Nach Abziehen des 
Losungsmittels wurden die Derivate mit HCI/Methanol bei 115°C fur 15 
min hydrolysiert. Nach Abziehen des Losungsmittels wurden die Derivate 

25 mit Diethylether extrahiert und mit GC-MS analysiert. Ein Hewlett Packard 
5973 MSD System wurde verwendet, um El (electron impact) Spektren 
(Saule: SE54, 12m x 0.25mm; df= 0.1 25p). Die Saulentemperatur wurde 
wie folgt programmiert: 50°C fur 2 min; 25°C/min bis 100°C; 5°C/min bis 
250°C. 



10 



30 
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B ispiel2 

Klonierung und Sequenzierung des Avilamycin Clusters 

5 Ein 60kb Abschnitt des Chromosoms des S. viridochromogenes TU57, das 
Gene enthalt, die an der Biosynthese von Avilamycinen beteiligt sind, 
wurde kloniert und sequenziert. Eine Analyse der DNA-Sequenz ergab 54 
„open reading frames". Es war bereits bekannt, daB das NDP-Glucose 
4,6-Dehydratase Gen aw'E und das Orsellinsaure Synthase-Gen aviM 

10 essentiell fur die Biosynthese von Avilamycin A sind. Es wurde die DNA, 
die die aviE und awM-Gene flankiert, isoliert und sequenziert, um den 
biosynthetischen Avilamycin-Gencluster zu identifizieren. Ein 17.6 kb 
Stuck upstream von aviM und ein 35.9 kb Stuck downstream von aviE 
wurden sequenziert. Die sequenzierten Gene und ihre Funktion sind 

is Tabelle 1 zu entnehmen. Abb. 109 zeigt die genetische Anordnung des 
biosynthetischen Avilamycin-Genclusters. Der Cluster wird durch ein 
Avilamycin-Resistenz-Gen (aviRb) und einem Desoxyzucker-Synthese- 
Gen (aviZ2) flankiert. Im Zentrum des sequenzierten Abschnitts sind 25 
Gene (aviXIO- aviGT4), die alle in gleicher Richtung transkribiert werden. 

20 

Beispiel 3 
Analyse der ORF's 

a) Allgemein 

25 Es wurde eine Computeranalyse der gefundenen Sequenzen der ORF's 
durchgefuhrt. Uberwiegend wurden die Ergebnisse eines 
Sequenzvergleichs mit den Kenntnissen uber die Biosynthese des 
Avilamycins A in Verbindung gesetzt. Die Ergebnisse dieser auf die 
vorliegenden Experimente gestutzten Uberlegungen sind in Tabelle 1 
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abzulesen. 

Im folgenden werden die funktionellen Uberlegungen an ausgewahlten 
Beispielen, insbesondere den Methyltransferasen und Halogenasen 
5 vorgestellt. 

b) 

Gene mit einer Funktion in der Biosynthese von 
Dichloroisoeverninsaure 

10 

AviM ist fur die Bildung von Orsellinsaure wahrend der Avilamycin- 
Biosynthese verantwortlich. AviN, das upstream von aviM liegt, durfte fur 
ein Enzym, das das Startsignal fur die Orsellinsaure-Synthese kontrolliert, 
kodieren. Die Biosynthese von Dichloroisoeverninsaure (A in Formel I) 

15 ausgehend von Orsellinsaure setzt Methylierung und Di-Halogenierung 
voraus. Oberraschend wurde festgestellt, daB AviG4, das DmpM, einer O- 
Demethylpuromycin-O-Methyltransferase aus S. alboniger (44% 
identische AS) ahnelt, und AviH, die PltA, einer Halogenase aus 
Pseudomonas fluorescens Pf-5. die an der Pyoluteorinbiosynthese (39% 

20 identische AS) beteiligt ist, ahnelt, fur die Modifizierung der Orsellinsaure 
verantwortlich sind. 

c) 

Gene mit einer Funktion in der Biosynthese von Desoxy-Zuckern. 

25 

2-Desoxy-D-Evalose unterscheidet sich von D-Olivose in einer 
Methylgruppe an C3-Position. Es ist anzunehmen, dali dNDP-4-keto-2,6- 
Didesoxy-D-Glucose ein wichtiges Zwischenprodukt in der Biosynthese 
dieses methylierten Desoxyzuckers ist. Methylierung durch AviG1, das 
30 TylCIII ahnelt, einer 3C-Methyltransferase aus S. fradiae (54% identische 
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AS), und Ketoreduktion durch entweder AviZ1 oder AviZ2, die beide 
Ketoreduktasen und Oxidoreduktasen ahneln, komplettieren die 
Biosynthese. 

5 d) 

Gene mit einer Funktion in der Modifikation der Heptasaccharid-Kette 

Neben aviGI, aviG4, aviRa und aviRb wurden vier weitere 
Methyltransferase-Gene im Cluster gefunden (aviG2, aviG3, aviGS und 

10 aviG6). Sie wurden dadurch als potentielle Methyltransferase-Gene 
identifiziert, daft entweder ihr Produkt Methyltransferasen aus anderen 
Organismen ahnelt, oder daft sie Motive enthalten, die typischerweise in 
verschiedenen methylierenden Proteinen gefunden werden. Es wurden 
von einer erfindungsgemaBen Zellinie verschiedene Avilamycin-Derivate, 

is die keine Methylgruppe an verschiedenen Positionen im Molekul 
enthielten, produziert. Das weist darauf hin, da& die Methylierung zu 
einem sehr spaten Zeitpunkt der Biosynthese erfolgt. AviG2, AviG3, AviGS 
und AviG6 diirften am D-Fucose-Rest (E), D-Mannose-Rest (F) und am 
Methyl-Eurekanat-Rest (H) von Avilamycin A methylieren. 

20 

Beispiel 4 

Herstellung einer aWG4-6en Substitutionsmutante 

Zur Inaktivierung von aviG4 wurde das Plasmid pMIKG4E3 konstruiert (s. 
25 Beispiel 1), urn den Ersatz des Wildtyp-Gens durch ein mutiertes Alle! zu 
erlauben. Nach Bildung von Protoplasten und Transformation von S. 
viridochromogenes mit dem Plasmid pMIKG4E3, wurden Erythromycin 
resistente Kolonien erhalten. Die Transformationseffektivitat war ungefahr 
10 Kolonien pro pg Plasmid-DNA. Mehrere Kolonien wurden ohne 
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Erythromycin auf Platten kultiviert, urn nach dem Verlust der Resistenz zu 
selektieren. Verschiedene sensitive Kolonien wurden erhalten, was darauf 
hindeutet, daft es sich um die Folge eines „double cross-over' 4 handelt. 
Zwei Mutanten, G4/24/20 und G4/24/30, wurden weiter untersucht. PCR- 
5 Fragmente, die unter Benutzung der Primer a viG4F- und aviG4R-DNA von 
G4/24/20 und G4/24/30 amplifiziert wurden, konnten nicht von A/col 
geschnitten werden, wahrend PCR-Fragmente aus Wildtyp-DNA von 
diesem Enzym geschnitten werden konnten. Um die Deletion in aw"G4 
nachzuweisen wurden wie folgt Southem-Blot-Analysen durchgefuhrt. 
O 10 Ncol-geschnittene, chromosomale DNA wurde aus G4/24/20 und 

G4/24/30 gewonnen. Als diese DNA mit einem 1.9 kb-Fragment, das das 
ganze av/G4-Gen enthielt, hybridisiert wurde, wurde ein 1 1 kb-Fragment 
detektiert, wahrend die zu erwartenden 5 kb- und 6 kb-Fragmente in der 
S. viridochromogenes TQ57 Linie gefunden wurden (Abb. 110). Die 
15 Mutante G4/24/30 wurde unter dem neuen Namen S. viridochromogenes 
GW4 fur weitere Experimente genutzt. 

Beispiel 5 

Herstellung einer aWG4~ aviH Doppelgen-Ersatz-Mutante 

20 

Das Plasmid pSP 1 S2Nar wurde entwickelt, um das aviH-Ger\ 
auszuschalten (s. Beispiel 1). S. viridochromogenes GW4 Protoplasten 
wurden mit diesem Plasmid transformiert. Es traten ca. 20 erythromycin- 
resistente Kolonien pro pg DNA auf. Einige davon wurden zum Screening, 

25 ob die Erythromycin-Resistenz verloren geht (was ein „double-cross-over" 
anzeigt), kultiviert. Die Mutante GW4-AM1 wurde fur weitere Experimente 
ausgewahlt. Ein 1.34 kb PCR-Fragment, das unter Verwendung der 
Primer S2A und S2B aus H/3/16 gewonnen wurde, konnte von Narl nicht 
geschnitten werden, wahrend das PCR-Fragment aus GW4 vom Enzym 

30 verdaut wurde. Um die Deletion in aviH nachzuweisen wurde eine 



-45- 



Southern-Blot-Analyse durchgefuhrt. Chromosomale DNA aus H/3/16 
wurde mit Nari geschnitten und mit einer 3,7 kb Sonde, die das awH-Gen 
enthielt, hybridisiert. Es wurde ein 5.7 kb-Fragment detektiert, wahrend 
bei chromosomaler DNA aus GW4 die Fragment erwartungsgemaB bei 
5 4.3 kb und 1 .4 kb lagen (nicht gezeigt). 

Beispiel 6 

Vervollstandigung von S. viridochromogenes GW4 und S. 
viridochromogenes GW4-AM1 

Urn klar zu uberprufen, ob die Mutation nur die gewunschten und keine 
anderen Gene betrifft, wurden aviG4 und aviH hinter dem ermE-up 
Promoter ligiert, in das Integrationsplasmid pSET152 einkloniert und durch 
Protoplasten-Transformation in die entsprechenden Mutanten eingefuhrt. 
15 Die Produktion von Avilamycinen bzw. Gavibamycinen wurde wieder 
hergestellt. Damit ist jede Art von „upstream"- oder w downstream"-Effekt 
auszuschlieBen. 

Beispiel 7 

20 Analyse der neugebildeten Avilamycin-Derivate durch S. 
viridochromogenes GW4 und S. viridochromogenes GW4-AM1 

Avilamycin A (M+Na: 1425) und Avilamycin C (M+Na: 1427) wurden in 
Extrakten von S. viridochromogenes TQ57 durch Flussigchromatographie 
25 (LC)-Massenspektrometrie-Analyse nachgewiesen. Avilamycin C war die 
Hauptkomponente. Messung bei hoher Auflosung zeigte, daB beide 
Verbindungen 2 Chloratome enthalten, die an ihem typischen 
Isotopenmuster erkannt werden konnen. Die Masse der zwei durch S. 
viridochromogenes GW4 gebildeten Hauptverbindungen war 1411 (M+Na) 
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und 1413 (M+Na) (Abb. 111) was zeigt, daB aviG4 wirklich fur eine 
Methyltransferase kodiert. Die Hauptprodukte der Mutante GW4 wurden 
isoliert, durch Behandlung mit Ethyliodid ethyliert und unter Verwendung 
von Methanol und Salzsaure hydrolysiert. Die Reaktionsprodukte wurden 
5 durch GC-MS analysiert. Das Massenspektrum dieser Probe zeigte 
mehrere Peaks (Abb. 112). Der Peak by m/z 436 entspricht dem D- 
Olivosylester der Dichloro-di-O-ethyl-orsellinsaure und die meisten 
weiteren Peaks (m/z 405, m/z 275, m/z 247) entsprachen Fragmenten, die 
vom Orsellinsau re-Rest ausgehen (Abb. 112). Das legt den SchluB nahe, 
^ 10 dali die Differenz zwischen Avilamycin A (C) und dem neuen Derivat, 

Gavibamycin A1 (A3), aus einer Veranderung der Struktur des 
OrsellinsSure-Rests resultiert. 



Gavibamycin A1 und A3 entsprechen der allgemeinen Formel I mit der 
15 folgenden Bedeutung fur die Reste R1-R9: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


A1 


COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


A3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 



S. viridochromogenes GW4-AM1 wurde auch durch HPLC-MS analysiert. 
Die Masse der zwei Haupt-Avilamycin-Derivate war 1343 (M+Na) und 

20 1345 (M+Na). Bei einem Vergleich des Isotopenmusters der Haupt- 
Derivate aus der Mutante GW4 zeigte das Isotopenmuster der 
Hauptprodukte der Mutante GW4-AM1 keine spezifischen Signale fur 
Chloridionen (Abb. 111), was darauf hindeutet, dad die Inaktivierung von 
aviH zum Verlust beider Chlorid-Atome fuhrt. Die neuen Derivate wurden 

25 Gavibamycin B 1 (Avilamycin A-Analogon) und Gavibamycin B3 
(Avilamycin C-Analogon) genannt. 
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Gavibamycin B1 und B3 entsprechen der allgemeinen Formel I mit der 
folgenden Bedeutung fur die Reste R1-R9: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


B1 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


B3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 



5 

Beispiel 8 

Biologische Eigenschaften von Gavibamycin A3 

Das antimikrobielle Spektrum von Gavibamycin A3 wurde bestimmt und 
10 mit dem von Avilamycin A verglichen. Dabei wurde die „broth- 
microdilution M -Methode gemaB den Vorschriften des nationalen 
Kommittees fur klinische Labor-Standards angewandt. Beide Metaboliten 
zeigten antibiotische Aktivitat gegen Bacillus subtilis, Staphylococcus 
aureus ATCC6538, Staphylococcus aureus ATCC6538P, Staphylococcus 
is aureus ATCC29213, Staphylococcus aureus Q48-1.2.1, Enterococcus 
faecalis ATCC29212, Enterococcus faecalis H-7-6 und Streptococcus 
pneumoniae ATCC4961 9. 

Erste Tests zeigen weiter, daB Gavibamycin A3 etwas aktiver gegen 
20 verschiedene Staphylococcus aureus Stamme ist als Avilamycin A und es 
scheint zusatzlich viel hydrophiler zu sein wie an den Rf-Werten 
abzusehen ist. Auch die nicht-chlorierten Gavibamycin-Derivate waren 
antibiotisch aktiv. 



25 



Beispiel 9 

Die Mutanten S. viridochromogenes GW2 und GW5 sowie die durch 
diese gebildeten erfindungsgema&en Avilamycin-Derivate 
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Wie bei den Varianten GW4 und GW4-AM1 wurden basierend auf S. 
viridochromogenes Mutanten GW2 und GW5 hergestellt, wobei bei alien 
von beiden Mutanten synthetisierten Avilamycin-Derivaten jeweils R3 = 

5 OH ist und bei den Produkten der Mutante GW2 R6 = H und bei den 
Produkten der Mutante GW5 R9 = H ist. Dabei wurden vollig analog wie in 
den Beispielen 4 bis 6, insbesondere 5, vorgegangen , so dass bei GW2, 
einer Doppelmutante, neben aviG4 (s. Bsp. 4) auch aviG2 genetisch 
verandert (ausgeschaltet) wurde. Bei der Mutante GW5, ebenfalls einer 

10 Doppelmutante, wurde neben aviG4 auch aviG5 genetisch verandert 
(ausgeschaltet). An den erfindungsgemaBen Produkten dieser Mutanten 
GW2 und GW5 ist erkennbar, dass die entsprechenden 
Methyltransferasen (aviG2 bzw. aviG5 und jeweils aviG4) ausgeschaltet 
wurden. 

15 

Beispiel 10 

Parenterale Applikationsform 



5 g Gavibamycin A3 werden in 1 I Wasser, ggf. unter Einsatz eines 
20 pharmazeutisch gut vertraglichen Loslichkeitsverbesserers, fur 
Injektionszwecke bei Raumtemperatur gelost und anschlie&end durch 
Zugabe von wasserfreier Glukose fur Injektionszwecke auf isotone 
Bedingungen eingestellt. 

Appliziert werden davon bei einem Durchschnittspatienten von ca. 65 kg 
25 Korpergewicht beispielsweise 0,5 ml also 2,5 mg bzw. « 40 pg/kg. Die 
verabreichte Dosis zeigte keinerlei Kontraindikation und erwies sich fur die 
Patienten als gut vertraglich. Auch eine bis zu 20-fach hohere Dosierung 
von Gavibamycin A3 erwies sich als toxikologisch unbedenklich und gut 
vertraglich. 
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Beispiel 11 

Zusammenfassend ist festzustellen, daB erfindungsgemaB eine detaillierte 
Sequenzanalyse des avi Gensatzes mehrere Merkmale aufweist, die ein 
5 Modell eines biosynthetischen Stoffwechselwegs zu erfindungsgemaSen 
komplexen Oligosaccharid-Antibiotika vorschlagen. Die Funktion der fur 
die Zuckerbiosynthese verantwortlichen Gene kann aus ihren 
Aminosauresequenzen abgeleitet werden, die solchen Proteinen ahneln, 
die an der Biosynthese von D-Olivose in anderen Organismen beteiligt 

10 sind. Wie fur die Biosynthese von D-Olivose in Streptomyces 
violaceoruber TQ22 (Granaticin-Produzent) und Streptomyces fradiae 
(Urdamycin-Produzent) beschrieben, beginnt die Biosynthese vom 
GIukose-1-Phosphat, das zu dTDP-D-Olivose und dTDP-2-Desoxy-D- 
Evalose durch mehrere Enzyme konvertiert wird. Ein neues Merkmal in 

15 diesem Stoffwechseiweg ist, daB daran drei verschiedene dNDP-Hexose- 
4,6-Dehydratase-Gene beteiligt sind. Auf der Basis von 
Sequenzhomologien ist AviE1 eine dTDP-Glukose-4,6-Dehydratase und 
AviE3 eine GDP-Mannose-4,6-Dehydratase, was anzeigt, daB die 
Biosynthese von einigen dieser verschiedenen Zuckereinheiten aus 

20 verschiedenen nukleotidgebundenen Hexosepools beginnt. Auf der Basis 
der Struktur von Avilamycin A und auBerdem indiziert durch die 
vermeintliche Funktion von einigen Genprodukten beginnt die Biosynthese 
von D-Lyxose sogar von einem dritten Zucker-Pool, so daB es sich urn ein 
Produkt des Pentose-Phosphat-Stoffwechselwegs handeln konnte. Rest H 

25 von Avilamycin A ist ursprunglich als Methyleurekanat, abgeleitet von 2,3- 
di-O-Methylen-^.S-Dihydroxyhexansaure, beschrieben worden. Die 
erfindungsgemaSe Sequenzanalyse allerdings zeigt, daB Methyleurekanat 
auch das Produkt eines biosynthetischen Zuckerstoffwechselwegs ist. 
Dies alles zusammengenommen laBt aufgrund der Zahl der 

30 Zuckereinheiten darauf schlieBen, daB das Avilamycin-Cluster sechs 
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Glykosyltransferase-Gene aufweist. Allerdings sind nur vier im 
erfindungsgemaBen Avilamycin-Cluster gefunden worden. Eine denkbare 
Erklarung konnte die Beteiligung von einer oder mehr 
Glykosyltransferasen in mehreren Syntheseschritten sein oder die 
5 Beteiligung von Glykosyltransferasen, die in Regionen auGerhalb dieses 
Gen-Clusters codiert werden. Drei von vier Glykosyltransferasen erinnern 
starker an Glykosyltransferasen fur die Biosynthese von 0-Antigen- 
Strukturen oder Zellwandpolysacchariden, was durch die 
polysaccharidahnliche Struktur von Avilamycinen erklart werden kann. 

Der avi Stoffwechselweg enthalt sogar weitere interessante Merkmale: 
zwei Orthoesterbrucken und eine Methylenbrucke. Unter Berucksichtigung 
der oxidativen Natur dieser C-O-C-Arrangements durften die cc- 
Ketoglutarat-abhangigen Oxygnasen Avid, Avi02 und Avi03 die Bildung 

is dieser seltenen Bindung katalysieren. Es wird daher erfindungsgemaB 
beschrieben, daB solche Enzyme molekularen Sauerstoff als direkten 
Elektronenakzeptor fur die Oxidation durch den Gebrauch von a- 
Ketoglutarat als Cosubstrat verwenden und hierdurch schlieRlich die C-O- 
C-Bindungen, Succinat und C0 2 produzieren. Avilamycin A- 

20 Heptasaccharid wird durch Methylierung, durch Ankopplung von Acetat, 
Ankopplung von Dichloroisoeverninsaure und durch Ankopplung von einer 
Isobutyryleinheit modifiziert. Sechs Methyltransferase-Gene sind im 
Cluster vorhanden, was der Zahl nach fur die Avilamycin-Biosynthese 
ausreicht, wahrend die Gene die fur die Ankopplung der anderen Reste 

25 verantwortlich sind, noch nicht lokalisiert worden sind. Interessanterweise 
wurde erfindungsgemaU herausgefunden, daB aviB1 und aviB2 solche 
Enzyme kodieren, die der Alpha- und der Beta-Kette von Komponenten 1 
der 2-Oxosauredehydrogenase-Komplexe ahnlich sind. Diese Komplexe 
werden normalerweise aus 3 enzymatischen Einheiten zusammengesetzt, 

30 namlich den TPP-abhangigen Dyhydrogenasen (Heterotetramere (a 2 p 2 ), 
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Dihydrolipoamide-Acetyltransferasen (Homomultirnere) und 

Dihydrolipoamid-Dehydrogenasen (Homodimere). Die ORFs, die fur die 
letztgenannten Komponenten dieser Komplexe kodieren, sind entweder 
noch nicht lokalisiert worden innerhalb des Clusters, liegen nicht im 
5 Cluster oder werden fur die Biosynthese von Avilamycinen uberhaupt nicht 
gebraucht. 

Weiterhin wurde Gavibamycin A3 auf seine antibiotische Aktivitat getestet. 
Die ersten MIC-Versuche zeigten, daB Gavibamycin A3 etwas starker 
10 gegen verschiedene Staphylococcus aureus-Stamme als Avilamycin A 
aktiv ist. Daruber hinaus ist es etwas starker hydrophil als Avilamycin A, 
wie durch die Retentionsfaktoren aus der DC- und HPLC-Analyse gezeigt 
wurde. Die nicht-chlorierten Gavibamycin-Derivate sind auch antibiotisch 
aktiv. 



15 
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Patentansprfiche 

1. Avilamycin-Derivat gemaB allgemeiner Formel I, auch in Form 
seiner Diastereomere oder Enantiomere bzw. razemischer oder 
5 anderer Gemische oder reiner Diastereomere und/oder 

Enantiomere, 



R1 




, worin unabhangig voneinander mit unten folgender Ausnahme 

R1 ausgewahlt ist aus H, COCH 3 , COC 4 H 9 , COCH(CH 3 ) 2 oder 
COCH2CH3, 

20 

R2 ausgewahlt ist aus H, CHO, COCH 3 oder CH(OH)CH 3 , 
R3 OCH3 entspricht, 
25 R4 CI entspricht, 

R5 CI entspricht, 



30 



R6 CH 3 entspricht, 

R7 H, CH 3 oder CH 2 OH entspricht, 
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R8 CH 3 entspricht 
und 

5 

R9 CH 3 entspricht, 

worin in Bezug auf mindestens einen der Reste R3-R6, R8 oder R9 in 
Formel I abweichend von der voranstehenden Definition folgendes gilt: 

R3 ist durch OH zu ersetzen, 

R4 ist durch H zu ersetzen, 

15 R5 ist durch H zu ersetzen, 

R6 ist durch H zu ersetzen, 

R8 ist durch H zu ersetzen 

und/oder 

R9 ist durch H zu ersetzen, 

25 mit der MaBgabe, daB R1-R9 nicht gleichzeitig die Bedeutungen 

gemaB der jeweiligen Kombination in einer der Verbindungen 1-4 
annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


1 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


2 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


H 


CH 3 


CH 3 


CH 3 


CH 3 




20 



-55- 



3 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


4 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 



2. Avilamycin-Derivat gemaB Anspruch 1, dadurch gekennzeichnet, 
daB mindestens R3 durch OH zu ersetzen ist, mit der MaBgabe, 
dad R1-R9 nicht gleichzeitig die Bedeutungen gemaB der 
5 Kombination in der Verbindung 1 annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


1 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


CI 


CH 3 


CH 3 


CH 3 


CH 3 



3. Avilamycin-Derivat gemaB einem der Anspruche 1 oder 2, dadurch 
gekennzeichnet, daB mindestens R4 und R5 in Formel I durch H zu 
10 ersetzen sind. 



4. Avilamycin-Derivat gemaB einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, daB mindestens R6, R8 und/oder R9 durch H zu 
ersetzen ist/sind, mit der MaBgabe, daB R1-R9 nicht gleichzeitig die 
15 Bedeutungen gemaB der Kombination in der Verbindung 3 oder 

nicht gleichzeitig die Bedeutungen gemaB der Kombination in der 
Verbindung 4 annehmen konnen: 



Nr. 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


3 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


4 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 



20 5. Avilamycin-Derivat gemaB einem der Anspruche 1 bis 4, dadurch 
gekennzeichnet, daB zum einen mindestens R3 durch OH zu 
ersetzen ist und zum anderen mindestens R4 und R5 durch H zu 
ersetzen sind oder mindestens R6, R8 und/oder R9 durch H zu 
ersetzen ist/sind. 



25 
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6. Avilamycin-Derivat gemaB allgemeiner Formel I, auch in Form 
seiner Diastereomere Oder Enantiomere bzw. razemischer oder 
anderer Gemische oder reiner Diastereomere und/oder 
Enantiomere, ausgewahlt aus Verbindungen, in denen R1-R9 
jeweils wie folgt kombiniert sind: 



R1 


R2 


R3^ 


R4 


R5 


R6 


R7 


R8 


R9 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH2CH3 


H 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


H 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COC4H9 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


CH 3 


CH 2 OH 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CHO 


OH 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


CH 3 


H 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 




COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


H 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


H 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH3 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COC4H9 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


CH 3 


CH 2 OH 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CHO 


OH 


H 


H 


CH 3 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


CH 3 


H 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


H 


CH 3 


CH 3 


H 


CH 3 




COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


H 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 
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COCH 3 


COCH 3 


OH 


CI 


CI 


1 1 

H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 1 


CH 3 


CH 3 


H 


COCH3 


OH 


CI 


CI 


H 


CH 3 ! 


CH 3 


CH3 


COCH3 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


H 


CH(OH)CH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


H 


CI 


H 


CH 3 


CH 3 


CH 3 


COC4H9 


COCH3 


OH 


CI 


CI 


H 


CH 3 


CH 3 1 


CH3 


COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


H 


H 


CH 3 


CH 3 


CH 3 


COCH 2 CH 3 


COCH 3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


H 


CH 2 OH 


CH 3 


CH 3 


COCH(CH 3 ) 2 


CHO 


OH 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 
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CH 3 


CH 3 


COCH(CH 3 ) 2 


COCH3 


OH 


CI 


CI 
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CH 3 
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CH 3 




COCH(CH 3 ) 2 


COCH 3 


OH 


CI 


CI 


CH 3 


CH 3 
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CH 3 


COCH 2 CH 3 
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OH 


CI 


CI 


CH 3 


CH 3 
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CH 3 


COCH 3 


COCH3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


H 


COCH 3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


COCH 3 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


H 


CH(OH)CH 3 


OH 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


COCH(CH 3 ) 2 


COCH 3 


OH 
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CI 


CH 3 


CH 3 


H 


CH 3 
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OH 
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CI 


CH 3 


CH 3 
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CH 3 
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CH 3 
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COCH 2 CH 3 


COCH 3 


OH 


CI 


CI 
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CH 3 
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COCH(CH 3 ) 2 
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7. Avilamycin-Derivat, dadurch erhaltlich, dad in einer kultivierbaren 
Zelle, die die notigen Gene bzw. Enzyme zur Synthese eines 
Orthosomycin-Grundkorpers bestehend aus 



(a) einem endstandigen Dichloroisoeverninsaure-Rest (A in 
Formel I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 

5 in Formel I) aus: 

(i) zwei D-OIivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose-Rest (E), 
10 (iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-)Eurekanat Rest (H) 

aufweist, mindestens eine Nukleinsaure, deren Sequenz zu 
15 mindestens 95%, vorzugsweise 97%, insbesondere genau, der 

Nukleinsauresequenz gemaB einer der Abbildungen 1 bis 54 
entspricht, gentechnologisch verandert, deletiert Oder nicht 
exprimiert wird, die so modifizierte Zelle kultiviert wird, der 
Kulturuberstand gewonnen und aufgearbeitet wird, das Oder die 
20 Avilamycin-Derivat/e aufgereinigt und isoliert wird und 

gegebenenfalls verschiedene Derivate getrennt werden, 



mit der Ma&gabe, daB R1-R9 nicht gleichzeitig die Bedeutungen 
gemaB der jeweiligen Kombination in einer der Verbindungen 1-16 
25 annehmen konnen: 



Nr 


R1 


R2 


R3 


R4 


R5 


R6 


R7 


R8 


R9 


1 


COCH(CH 3 ) 2 


COCH 3 


OH 


H 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


2 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


H 


CH 3 


CH 3 


CH 3 


CH 3 


3 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


H 


CH 3 


CH 3 


CH 3 


4 


COCH(CH 3 ) 2 


COCH 3 


OCH 3 


CI 


CI 


CH 3 


CH 3 


H 


CH 3 


5 


COCH(CH 3 ) 2 


CHO 


OCH 3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 



-60- 



6 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


CH 3 


H 


CH 3 


CH 3 


7 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


8 


COCH2CH3 


H 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


9 


COCH3 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


10 


COCH(CH 3 ) 2 


CH(OH)CH 3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


11 


H 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


12 


COCH3 


CH(OH)CH 3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


13 


H 


CH(OH)CH 3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


14 


COC4H9 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


15 


COCH 2 CH 3 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 3 


CH 3 


CH 3 


16 


COCH(CH 3 ) 2 


COCH3 


OCH3 


CI 


CI 


CH 3 


CH 2 OH 


CH 3 


CH 3 



8. Avilamycin-Derivat gemaB Anspruch 7, dadurch gekennzeichnet, 
daB die kultivierbare Zelle ausgewahlt ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes Oder einer Zelle, die mit 
Ausnahme der gentechnologisch veranderten, deletierten oder nicht 
exprimierten Nukleinsaure/n die Nukleinsauren gemaB einer 
Sequenz einer der laufenden Nr. 1-54 (gemaB Tabelle 1 i.V.m. Abb. 
1) bzw. dazu zu mindestens 95%, vorzugsweise 97 %, homologe 
Nukleinsauren enthalt oder das Gencluster gemaB Abb. 109 
enthalt, vorzugsweise ausgewahlt ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes, insbesondere einer Zelle vom 
Typ Streptomyces viridochromogenes Tu 57. 

9. Avilamycin-Derivat gemaB einem der Anspruche 7 oder 8, dadurch 
gekennzeichnet, daB die veranderte/n Nukleinsaure/n fur eine 
Methyltransferase und/oder fur eine Halogenase kodierte/n. 

10. Avilamycin-Derivat gemaB Anspruch 9, dadurch gekennzeichnet, 
daB die Sequenz/en der veranderte/n Nukleinsaure/n vor der 
Veranderung zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der/den Nukleinsauresequenz/en mindestens 
einer der Sequenzen mit laufender Nr. 1 oder 2-7 (gemaB Tabelle 1 
i.V.m. Abb. 1), vorzugsweise einer der Sequenzen mit laufender Nr. 



-61 - 



1, 2, 4 oder 6 (Tabelle 1 i.V.m. Abb. 1) entspricht. insbesondere der 
Sequenz mit laufender Nr. 2 oder den Sequenzen mit den 
laufenden Nr. 2 und Nr. 1, Nr. 2 und Nr. 4 oder Nr. 2 und Nr. 6 
(gemaS Tabelle 1 i.V.m. Abb. 1). 

Avilamycin-Derivat gemaR einem der Anspruche 7 bis 10, dadurch 
gekennzeichnet, dad die Veranderung der Nukleinsaure/n dazu 
fuhrt, daR das oder die durch die gentechnolgisch veranderte/n 
Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
gentechnologischen Veranderung nicht mehr synthetisiert 
wird/werden. 

Avilamycin-Derivat, gemaB einem der Anspruche 1 bis 5, 6 oder 7 
bis 11, dadurch gekennzeichnet, dafc es hydrophiler ist als 
Avilamycin A oder C bzw. Evernimycin (Ziracin). 

Nukleinsaure in ihrer Sequenz zu mindestens 95%, vorzugsweise 
97%, insbesondere genau, entsprechend der Nukleinsauresequenz 
gemafc einer der Sequenzen mit laufender Nr. 1 bis 51 (gemaB 
Tabelle 1 i.V.m. Abb. 1). 

Nukleinsaure gemaB Anspruch 13, dadurch gekennzeichnet, dafi 
die Nukleinsaure zu mindestens 95%, vorzugsweise 97%, 
insbesondere genau, der Nukleinsauresequenz gemafc einer der 
Sequenzen mit laufender Nr. 1 bis 32 und 48 bis 51 (gemaS Tabelle 
1 i.V.m. Abb. 1), vorzugsweise 1 bis 7, insbesondere 1, 2, 4 oder 6, 
entspricht. 

Gencluster enthaltend „Open reading frames", vorzugsweise 54, die 
in ihrer Nukleinsauresequenz zu mindestens 95%, vorzugsweise 
97%, insbesondere genau, den Nukleinsauresequenzen gemaB 
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den Sequenzen mit laufender Nr. 1 bis 54 (gemaB Tabelle 1 i.V.m. 
Abb. 1) entsprechen und die auf einerm Nukleinsaurestrang 
angeordnet sind, vorzugsweise gemaB Abb. 109. 



10 



16. Protein oder Polypeptid in seiner Aminosauresequenz zu 
mindestens 95%, vorzugsweise 97%, insbesondere genau, 
entsprechend der Aminosauresequenz gemaB einer der 
Sequenzen mit laufender Nr. 55 - 104 (gemaB Tabelle 1 i.V.m. 
Abb. 1). 



17. Protein oder Polypeptid gemaB Anspruch 16, dadurch 
gekennzeichnet, daB das Protein oder Polypeptid zu mindestens 
95%, vorzugsweise 97%, insbesondere genau, der 
Nukleinsauresequenz gemaB einer der Sequenzen mit laufender 

15 Nr. 55 bis 86 (gemaB Tabelle 1 i.V.m. Abb. 1), vorzugsweise 55 bis 

61, insbesondere 55, 56, 58 oder 60, entspricht. 

18. Protein oder Polypeptid kodiert durch eine Nukleinsaure gemaB 
einem der Anspruche 13 oder 14. 

20 

19. Gentechnologisch veranderte Zelle enthaltend mindestens eine 
nicht endogene Nukleinsaure gemaB einem der Anspruche 13 oder 
14, einen nicht-endogenen Gencluster gemaB Anspruch 15 
und/oder ein nicht-endogenes Protein oder Polypeptid gemaB 

25 einem der Anspruche 16-18. 

20. Zelle enthaltend mindestens eine gentechnologisch veranderte 
Nukleinsaure, deren Sequenz vor der Veranderung zu mindestens 
95%, vorzugsweise 97%, insbesondere genau, der 

30 Nukleinsauresequenz gemaB einer der Sequenzen mit laufender 

Nr. 1 bis 54 (gemaB Tabelle 1 i.V.m. Abb. 1) entsprach. 
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Zelle vom Typ Streptomyces viridochromogenes, vorzugsweise 
vom Subtyp TQ57, dadurch gekennzeichnet, daB mindestens eine 
der Nukleinsauren mit einer Sequenz gemafc einer der Sequenzen 
mit laufender Nr. 1-54 (gemaB Tabelle 1 i.V.m. Abb. 1) 
gentechnologisch verandert oder deletiert wurde. 

Zelle gemaB Anspruch 21, dadurch gekennzeichnet, daR 
mindestens eine der Nukleinsauren mit einer Sequenz gemaB einer 
der Sequenzen mit laufender Nr. 1 oder 2-7 (gemaS Tabelle 1 
i.V.m. Abb. 1), vorzugsweise mit einer der Sequenzen mit laufender 
Nr. 1, 2, 4 oder 6 (Tabelle 1 i.V.m. Abb. 1), insbesondere mit einer 
Sequenz mit laufender Nr. 2 oder mit den Sequenzen mit den 
laufenden Nr. 2 und Nr. 1, Nr. 2 und Nr. 4 oder Nr. 2 und Nr. 6 
(gemafc Tabelle 1 i.V.m. Abb. 1), gentechnologisch verandert oder 
deletiert wurde. 

Zelle gemaS Anspruch 21 vom Mutanten-Typ Streptomyces 
viridochromogenes GW4, Streptomyces viridochromogenes, GW4- 
AM1, Streptomyces viridochromogenes GW2 oder Streptomyces 
viridochromogenes GW5, dadurch gekennzeichnet, daB vom 
Mutanten-Typ Streptomyces viridochromogenes GW4 Avilamycin- 
Derivate synthetisiert werden, in denen R3 = OH ist, vom Mutanten- 
Typ Streptomyces viridochromogenes GW4-AM1 Avilamycin- 
Derivate synthetisiert werden, in denen R3 = OH, R4 = H und R5 = 
H sind, vom Mutanten-Typ Streptomyces viridochromogenes GW2 
Avilamycin-Derivate synthetisiert werden, in denen R3 = OH und R6 
= H sind und vom Mutanten-Typ Streptomyces viridochromogenes 
GW5 Avilamycin-Derivate synthetisiert werden, in denen R3 = OH 
und R9 = H sind. 
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Verwendung einer Nukleinsaure gemaR einem der Anspruche 13 
oder 14, eines Genclusters gemaR Anspruch 15, eines Proteins 
Oder Polypeptids gemaR einem der Anspruche 16 bis 18 und/oder 
einer Zelle gemaR einem der Anspruche 19 bis 22 zur Herstellung 
eines Avilamycin-Derivats, vorzugsweise gemaR einem der 
Anspruche 1 bis 12. 

Verfahren zur Herstellung von Avilamycin-Derivaten gemaR einem 
der Anspruche 1 bis 6 gekennzeichnet durch folgende Schritte: 

(1) in einer kultivierbaren Zelle, die die notigen Gene bzw. Enzyme 
zur Synthese des Orthosomycin-Grundkorpers bestehend aus 

(a) einem endstandigen Dichloroisoeverninsaure-Rest (A in 
Formel I) und 

(b) einem damit veresterten, uber normale Esterbindung und 
Orthoesterbindungen verknupften Heptasaccharid (B bis H 
in Formel I) aus: 

(i) zwei D-Olivose-Resten (B und C) 

(ii) einem 2-Desoxy-D-Evalose-Rest (D), 

(iii) einem D-Fucose-Rest (E), 

(iv) einem D-Mannose-Rest (F), 

(v) einem L-Lyxose-Rest (G) und 

(vi) einem (Methyl-) Eurekanat Rest (H) 

aufweist, wird mindestens eine Nukleinsaure, deren Sequenz 
zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
der Nukleinsauresequenz gemaR einer der Sequenzen mit 
laufenden Nr. 1 bis 54 (gemaR Tabelle 1 i.V.m. Abb. 1) 
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entspricht, gentechnologisch verandert, deletiert oder nicht 
exprimiert, 



(2) die so gentechnologisch veranderte Zelle wird kultiviert, 
5 (3) der Kulturuberstand wird gewonnen, 

(4) der Kulturuberstand wird aufgearbeitet und dabei das oder die 
entstandene/n Avilamycin-Derivat/e aufgereinigt und isoliert, 

(5) gegebenenfalls werden unterschiedliche Derivate getrennt. 

10 26. Verfahren gemaB Anspruch 25, dadurch gekennzeichnet, daB die 
kultivierbare Zelle ausgewahlt ist aus einer Zelle vom Typ 
Streptomyces viridochromogenes oder einer Zelle, die mit 
Ausnahme der gentechnologisch veranderten, deletierten oder nicht 
exprimierten Nukleinsaure die Nukleinsauren gemaR einer Sequenz 

15 mit laufender Nr. 1-54 (gemaB Tabelle 1 i.V.m. Abb. 1) bzw. dazu 

zu mindestens 95%, vorzugsweise 97 %, homologe Nukleinsauren 
enthalt oder den Gencluster gemaR Anspruch 14 enthalt, 
vorzugsweise ausgewahlt ist aus einer Zelle vom Typ Streptomyces 
viridochromogenes, insbesondere einer Zelle vom Typ 

20 Streptomyces viridochromogenes Tu 57. 



27. Verfahren gemaB einem der Anspriiche 25 oder 26, dadurch 
gekennzeichnet, daft die veranderte/n Nukleinsaure/n fur eine 
Methyltransferase und/oder fur eine Halogenase kodiert/en. 

25 

28. Verfahren gemaR Anspruch 27, dadurch gekennzeichnet, daft die 
Sequenz/en der veranderte/n Nukleinsaure/n vor der Veranderung 
zu mindestens 95%, vorzugsweise 97%, insbesondere genau, 
der/den Nukleinsauresequenz/en mindestens einer der Sequenzen 

30 mit laufender Nr. 1 oder 2-7 (gemali Tabelle 1 i.V.m. Abb. 1), 

vorzugsweise einer der Sequenzen mit laufender Nr. 1,2,4 oder 6 
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(Tabelle 1 i.V.m. Abb. 1) entspricht, insbesondere der Sequenz mit 
laufender Nr. 2 oder den Sequenzen mit den laufenden Nr. 2 und 
Nr. 1, Nr. 2 und Nr. 4 oder Nr. 2 und Nr. 6 (gemaft Tabelle 1 i.V.m. 
Abb. 1). 

Verfahren gemaB einem der Anspruche 25 bis 28, dadurch 
gekennzeichnet, dad die Veranderung der Nukleinsaure/n dazu 
fuhrt, daB das oder die durch die gentechnolgisch veranderte/n 
Nukleinsaure/n kodierte/n Protein/e oder Polypeptid/e nach der 
gentechnologischen Veranderung nicht mehr synthetisiert 
wird/werden. 

Arzneimittel enthaltend Avilamycin-Derivate gemaB einem der 
Anspruche 1 bis 12 sowie gegebenenfalls geeignete Zusatz- 
und/oder Hilfsstoffe. 

Verwendung eines Avilamycin-Derivats gemaB einem der 
Anspruche 1 bis 12 zur Herstellung eines Arzneimittels mit 
antibiotischer Wirkung zur Behandlung bzw. zur Herstellung eines 
Arzneimittels zur Behandlung von Erkrankungen, bspw. 
Infektionskrankheiten. 
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Zusammenfassung 



Die Erfindung betrifft Aviiamycin-Derivate, gentechnologische 
biosynthetische Verfahren zu deren Herstellung, Arzneimittel enthaltend 
5 diese Verbindungen, sowie die Verwendung dieser Verbindungen zur 
Herstellung eines Arzneimittels gegen Infektionskrankheiten wie auch 
Nucleinsauren, Proteine und Gencluster und entsprechende Zellen, die 
mit der Herstellung dieser Aviiamycin-Derivate verbunden sind. 



Sequenz des Avilamycin- 
Biosynthesegenclusters 
(Genstarts sind besonders 
gekennzeichnet) 



File, i AVI1 OOOVDNA* 

Range : 1 - 59816 Mode : Normal + Complementary 

Codon Table : Universal 

DVMRVAAFTSLLQI SVSA 
IWWGYPPSRRCFSSRCPR 
SGGDTRRRVDVSAPDVRV 

3 1 CCT AGG TGG TAG GCA TGC CGC CGC TTG CAG CTG TCT TCG ACC TAG CTG TGC CTG 
9 18 27 36 45 54 

5' GGA TCC ACC ATC CGT ACG GCG GCG AAC GTC GAC AGA AGC TGG ATC GAC ACG GAC 

GSTIRTAANVDR SWIDTD 
DPPSVRRRTSTEAGSTRT 
I HHPYGGERRQKLDRHGR 

RANNLSRRPPRGTVTTL S 
ARTT*RGGRRGGPSPP*R 
RARQEAVAEAAERHRHDV 

CGC GCG CGC AAC AAG TCG CTG GCG GAG CCG CCG GAG GGC CAC TGC CAC CAG TTG 
63 72 81 90 99 108 

j GCG CGC GCG TTG TTC AGC GAC CGC CTC GGC GGC CTC CCG GTG ACG GTG GTC AAC 

ARAL FSDRLGGLPVTVVN 
RARCSATASAASR*RWS T 
ARVVQRPPRRPPGDGGQR 

ASAAPTASICKPAPRSRR 
RPRPRRRRSASRRPGRGG 
VRVRGADGLHVEARAAVA 

CTG CGC CTG CGC CGG CCG CAG CGG CTC TAC GTG AAG CCG CGC CCG GCG CTG GCG 
117 126 135 144 153 162 

GAC GCG GAC GCG GCC GGC GTC GCC GAG ATG CAC TTC GGC GCG GGC CGC GAC CGC 

DADAAGVAEMHFGAGRDR 
TRTRPASPRCTSARAATA 
RG RGRRRRDALRRGPRPP 

PVTIRRVRPVPMPLASNM 
PCRSGG* GRCPCRCRAT * 
PAGHDE EGEARADAARQE 

GCC CCG TGG CAC TAG GAG GAG TGG GAG CCG TGC CCG TAG CCG TCG CGC GAC AAG 
171 180 189 198 207 216 

CGG GGC ACC GTG ATC CTC CTC ACC CTC GGC ACG GGC ATC GGC AGC GCG CTG TTC 

RGTVILLTLGTGIGSALF 
GAP* SS SPSARASAARCS 
GHRDPPHPRHGHRQRA VH 

S PARTGLVSSPWRS SW PW 
RRRGPGWCPAPGGRVGHG 
DVAGQDGVRLQAVEFEMA 

TAG CTG CCG CGG GAC CAG GGG TTG TGC CTC GAC CCG GTG GAG CTT GAG GTA CCG 
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225 234 243 252 26T 270 

ATC GAC GGC GCC CTG GTC CCC AAC ACG GAG CTG GGC CAC CTC GAA CTC CAT GGC 



IDGA LVPNTELGHLELHG 
STAPWSPTRSWATSNSMA 
RRRPGPQHGAGPPRTPWP 

SASFRAELLALSSSSSLQ 
H RRSARRWCPWPPRPAS S 
MVGLLAGGALGPLVLLQA 



GTA CTG CGG CTC TTC GCG CGG AGG TCG TTC CGG TCC CTC CTG CTC CTC GAC TCG 
279 288 297 306 315 324 

CAT GAC GCC GAG AAG CGC GCC TCC AGC AAG GCC AGG GAG GAC GAG GAG CTG AGC 



HDAEKRASSKAREDEEL S 
MTPRSAP PARPGRTRS * A 
*RREARLQQGQGGRGAEL 

SCQARRTWFYRAWTSI SN 
PASPGGRGSTGRGHRSAT 
PLVPGAADLLVEGMDLHQ 



ACC CTC GTG ACC CGG GCG GCG CAG GTC TTC ATG GAG CGG GTA CAG CTC TAC GAC 
333 342 351 360 369 378 

TGG GAG CAC TGG GCC CGC CGC GTC CAG AAG TAC CTC GCC CAT GTC GAG ATG CTG 



WEHWARRVQKYLAHVEML 
GSTGPAASRSTSPMSRCC 
GALGPPRPEVPRPCRDAV 

EGSSNMMPPPTLRLDWLN 
RGPAT* *RRRPSGCTGCT 
EGRLQEDDAAPHAALGVL 



AAG AGG GGC CTC GAC AAG TAG TAG CCG CCG CCC CAC TCG GCG TTC AGG GTG TTC 
387 396 405 414 423 432 

TTC TCC CCG GAG CTG TTC ATC ATC GGC GGC GGG GTG AGC CGC AAG TCC CAC AAG 



FSPELFI IGGG.VSRKSHK 
SPRSCSSSAAG*AASPTS 
LP GAVHHRRRGEPQVPQV 

RCRMSPMLASITGAWSCF 
GAG*RPC*PPSRGPGAAS 
EQVEDLADLRLDDRGLQL 



AAG GAC GTG GAG TAG CTC CCG TAG TTC CGC CTC TAG CAG GGC CGG GTC GAC GTC 
441 450 459 468 477 486 

TTC CTG CAC CTC ATC GAG GGC ATC AAG GCG GAG ATC GTC CCG GCC CAG CTG CAG 



FLHL IEGIKAEIVPAQLQ 
SCTS SRASRRRSSRPSCR 
PAPHRGHQGGDRPGPAAE 

L A _P ITPAAIRAASFSP *A 
CRRSRRPPSAPPPSPRSP 
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TTG TTG CGG CCC TAG CAG CCC CGC CGC TAC GCC CGC CGC CTC TTC CTG CCG ATC 
495 504 513 522 531 540 

AAC AAC GCC GGG ATC GTC GGG GCG GCG ATG CGG GCG GCG GAG AAG GAC GGC TAG 

NNAGIVGAAMRAAEKDG* 
TTPGS S GRRCGRRRRTAR 
QRRDRRGGDAGGGEGRLG 

GRRRPSGSSLAQRRDGPG 
GAVGPHDLRCPRAATVQV 
GRSAPT IWVVPGPPP *RS 

CGG GGC GCT GCG GCC CCA CTA GGT CTG CTG TCC CGG ACC GCC GCC AGT GGA CCT 
549 558 567 576 585 594 

GCC CCG CGA CGC CGG GGT GAT CCA GAC GAC AGG GCC TGG CGG CGG TCA CCT GGA 

APRRRGDPDDRAWRRSPG 
PRDAGVIQTTGPGGGHLD 
PATPG* SRRQGLAAVTWT 

AAPRPGAPWCGSRGHP* S 
PPPGRGQPGAAPDETRDR 
RRRAAARRALLR I KRATV 

GGC CGC CGC CCG GCG CCG GGA CGC CCG GTC GTC GGC CTA GAA GGC ACG CCA GTG 
603 612 621 630 639 648 

CCG GCG GCG GGC CGC GGC CCT GCG GGC CAG CAG CCG GAT CTT CCG TGC GGT CAC 

PAAGRGPAGQQPDLPCGH 
RRRAAALRASSRI FRAVT 
GGGPRP CGPAAGS SVRSR 

SVPS *RGETCGGPRPPSP 
HSRRD ADRRVAVRGPHRP 
ILGAILTGGYLWGAQTAL 

CTA CTC TGG CCG CTA GTC GCA GGG AGG CAT GTC GGT GGG CCG GAC CCA CCG CTC 
657 666 675 684 693 702 

GAT GAG ACC GGC GAT CAG CGT CCC TCC GTA CAG CCA CCC GGC CTG GGT GGC GAG 

DETGDQRPSVQPPGLGGE 
MRPAI SVPPYSHPAWVAR 
*DRRSASLRTATRPGWRG 

PSSGW* TDASGGAATPWR 
RHLAGD PTRRDGRRQRGG 
ATFLGMLHGGIGGGSDAV 

CCG CCA CTT CTC GGG GTA GTC CAC AGG CGG CTA GGG GGG CGG CGA CAG CCG GTG 
711 720 729 738 747 756 

GGC GGT GAA GAG CCC CAT CAG GTG TCC GCC GAT CCC CCC GCC GCT GTC GGC CAC 

GGEE PHQVSADPPAAVGH 
AV JKSPIRCPPIPPPLSA T 
R*RAP SGVRRSPRRCRPP 
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CWGWPSPSRYWWRRPRWT 
AGAGRRLRDTGGGARDGP 
PVLGVAFAIPVVVPATAL 



GCC GTG GTC GGG GTG CCG CTT CCG CTA GCC ATG GTG GTG GCC GCG CCA GCG GTC 
765 774 783 792 801 810 

CGG CAC CAG CCC CAC GGC GAA GGC GAT CGG TAC CAC CAC CGG CGC GGT CGC CAG 

RHQPHGEGDRYHHRRGRQ 
GTSPTAKAI GTTTGAVAR 
APAPRRRRSVPPPARSPG 

AGACGCRR*SACPCSCCA 
RGQAGVGGDPRVRAPVAR 
DGRRVWVATLVCVPL FLV 

CAG CGG GGA CGC GTG GGT GTG GCG GCA GTC CTG CGT GTG CCC GTC CTT GTC GTG 
819 828 837 846 855 864 

GTC GCC CCT GCG CAC CCA CAC CGC CGT CAG GAC GCA CAC GGG CAG GAA CAG CAC 

VAPAHPHRRQDAHGQEQH 
SPLRTHTAVRTHTGRNST 
RPCAPTPPSGRTRA GTAR 

TCRSRRGSCCRTSTASCS 
QVAHAVVRVAALRPL RAP 
SYLTLSSGFLLS-DLYGLL 

CGA CAT GTC GCA CTC GCT GCT GGG CTT GTC GTC GCT CAG CTC CAT CGG CTC GTC 
873 882 891 900 909 918 

GCT GTA CAG CGT GAG CGA CGA CCC GAA CAG CAG CGA GTC GAG GTA GCC GAG CAG 

AVQRERRPEQQRVEVAEQ 
LYSVSDDPNSSESR*PSR 
CTA*ATTRTAASRGSRAG 

C*PAASCAAAWGP*GPTP 
ADRRRLVPRRGARDAPPQ 
LMVAGCFLGGGLGTLRPN 

CTC GTA GTG CCG CGG CGT CTT GTC CGG CGG CGG GTC GGG CCA GTC GGC CCC CAA 
927 936 945 954 963 972 

GAG CAT CAC GGC GCC GCA GAA CAG GCC GCC GCC CAG CCC GGT CAG CCG GGG GTT 

EHHGAAEQAAAQPGQPGV 
SITAPQNRPPPSPVSRGL 
ASRRRRTGRRPARSAGGW 

FGACPRPRPPRGPAGYRR 
SVPAPGPG RPAARPATGG 
PFRRLAQAAPPPGPRRVA 



CCC TTT GGC CGC GTC CCG 
981 990 
GGG AAA CCG GCG CAG GGC 



GAC CCG GCG CCC CCC GCC 
999 1008 
CTG GGC CGC GGG GGG CGG 



GGG CCC CGC GGC ATG GCG 
1017 1026 
CCC GGG GCG CCG TAC CGC 
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GNRRRAWAAGGGPGRRTA 
ETGAGPGPRGAARGAVPP 



PRRPRVPRVLAASPSPGP 
RAVPGCPGYWPPAPPRAP 
APSPAARATGPRRQPVPR 

GCG CCC GCT GCC CCG GCG TGC CCG GCA TGG TCC CGC CGC GAC CCC CTG CCC GGC 
1035 1044 1053 1062 1071 1080 

CGC GGG CGA CGG GGC CGC ACG GGC CGT ACC AGG GCG GCG CTG GGG GAC GGG CCG 

RGRRGRTGRTRAALGDGP 
AGDGAARAVPGRRWGTGR 
RATGPHGPYQGGAGGRAG 

PAPPGPRSPPGPPGPPGA 
HLPRAPVAPRAQLVPRAL 
TSRAPRSPQAPRS SRAPW 

CCA CCT CGC CCG CCC GGC CCT GCC GAC CCG CCC GGA CCT CCT GGC CCG CCC GGT 
1089 1098 1107 1116 1125 1134 

GGT GGA GCG GGC GGG CCG GGA CGG CTG GGC GGG CCT GGA GGA CCG GGC GGG CCA 

GGAGGPGRLGGPGGP GGP 
VERAGRDGWAGLEDRAGQ 
WSGRAGTAGRAWRTGRAS 

TGARVAGAARSVATAARR 
RGPG SRERRARFRRRRAG 
GDRGP GSGGRAFGGD GRA 

CGG CAG GGC CGG GCC TGG CGA GGG CGG CGC GCG CTT TGG CGG CAG CGG CGC GCG 
1143 1152 1161 1170 1179 1 188 

GCC GTC CCG GCC CGG ACC GCT CCC GCC GCG CGC GAA ACC GCC GTC GCC GCG CGC 

AVPAR TAPAARETAVAAR 
PSRPGPLPPRAKPPSPRA 
RPGP DRSRRARNRRRRAP 

VAGAQFSDAGAE. SCVTKV 
CRERRSHTRERRAAYRR* 
AGSGGPI LGSGGRQMGDE 

GCG TGG CGA GGG CGG ACC TTA CTC AGG CGA GGG CGG AGC GAC GTA TGG CAG AAG 
1197 1 206 1215 1224 1233 1242 

CGC ACC GCT CCC GCC TGG AAT GAG TCC GCT CCC GCC TCG CTG CAT ACC GTC TTC 

RTAPAWNESAPASLHTVF 
APLPPGMSPLPPRCIPSS 
HRSRLE*VRSRLAAYRLH 

GGRVAAGAALSVGGVGRR 
GAGCRRGRRSRCGAWGAG 
GRGAGGGGGRAVGRGGRA 

TGG GGC GGG GCG TGG CGG CGG GGG CGG CGC TCG CTG TGG GGC GGG TGG GGC GCG 



125.1 1260 1269* 1278' 1287 1296 

ACC CCG CCC CGC ACC GCC GCC CCC GCC GCG AGC GAC ACC CCG CCC ACC CCG CGC 



TPPRTAAPAASDTPPTPR 
PRPAPPPPPRATPRPPRA 
PAPHRRPRRERHPAHPAP 

RRRCRRRRLTDRKTGPLD 
GAVAVADAYRTA SRVR C T 
AQSPLPTPTAHRAEYGAP 

GCG GAC GCT GCC GTT GCC GCA GCC GCA TCG CAC AGC GCG AAG CAT GGG CCG TCC 
1305 1314 1323 1332 1341 1 350 

CGC CTG CGA CGG CAA CGG CGT CGG CGT AGC GTG TCG CGC TTC GTA CCC GGC AGG 

RLRRQRRRRSVSR FVPGR 
ACDGNGVGVACRASYPAG 
PATATA SA*RVALRTR QV 

RGTH SW QVLKPR S I HR I A 
ADQTAGSSWSLDA*TGFR 
R TRHPEVPGV*TPKHASD 

AGC GCA GGA CAC ACC GAG GTG ACC TGG TTG AAT CCA GCC GAA TAC ACG GCT TAG 
1359 1368 1377 1386 1395 1404 

TCG CGT CCT GTG TGG CTC CAC TGG ACC AAC TTA GGT CGG CTT ATG TGC CGA ATC 

SRPVWLHWTNLGRLMCR I 
RVLCGS TGPT "*VGLCAE S 
ASCVAPIjDQLRSAYVPNR 

W*VRRPASRPWTNSVAGP 
GDSVGHPPGQGHTRYPVP 
GMLCATPRVKAMHE IRCR 

CGG GTA GTC TGT GCG GCA CCC CGC CTG GAA CCG GTA CAC AAG CTA TGC CGT GGC 
1413 1422 1431 1440 1449 1458 

GCC CAT CAG ACA CGC CGT GGG GCG GAC CTT GGC CAT GTG TTC GAT ACG GCA CCG 

AHQTRRGADLGHVFDTAP 
pi RHAVGRTLAMCS IRHR 
PSDTPWGGPWPCVRYGTG 

GPGARRLSTSRGTRRC * R 
APDPVGYVPPDARADADD 
PRTRCAT SQHIPGHTQMM 

CCC GGC CCA GGC CGT GCG GCA TCT GAC CAC CTA GCC GGG CAC GCA GAC GTA GTA 
1467 1476 1485 1494 1 503 1 51 2 

GGG CCG GGT CCG GCA CGC CGT AGA CTG GTG GAT CGG CCC GTG CGT CTG CAT CAT 

GPGPARRRLVDRPVRLHH 
GRVRHAVDWWIGPCVCI I 
AGSGTP *TGGSARASASS 

CR^LDFF SRAGAWGARFDE 
A G F I SSPGPGLGALGSTR 
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GAC GTG GCT TCT AGC TTC TTC CTG GCC CGG GGT CGG GTC GGT CGG GAG TTC AGG 
1 521 1 530 1539 1548 1 557 1 566 

CTG CAC CGA AGA TCG AAG AAG GAC CGG GCC CCA GCC CAG CCA GCC CTG AAG TCC 

LHRRSKKDRAPAQPALKS 
CTEDRRRTGPQPSQP * SP 

APKI EEGPGPSPASPEVL 

★ TRSTAVHRERDSDDTQR 
ERVPLRLTDSVI P I TPRG 
RVYPFDCRTA*SRFRRDA 

AGA GTG CAT GCC CTT CAG CGT TGC ACA GCG AGT GCT AGC CTT AGC AGC CAG ACG 
1575 1584 1593 1602 1611 1620 

TCT CAC GTA CGG GAA GTC GCA ACG TGT CGC TCA CGA TCG GAA TCG TCG GTC TGC 

SHVREVATCRSRSESSVC 
L T Y G K S Q R^ VAHDRNRR S A \/A 
S R T G S R N (vj SLTIGIVGL P 

I DALRGQEVGQGLVVHQR 
FTPLDVRNLARVLFSTSA 
SHRCTSGT*RGSWSRRAP 

GCT TAC AGC CGT TCA GCT GGG ACA AGT TGC GGG ACT GGT TCT TGC TGC ACG ACC 
1629 1638 1647 1656 1665 1674 

CGA ATG TCG GCA AGT CGA CCC TGT TCA ACG CCC TGA CCA AGA ACG ACG TGC TGG 

RMSASRPCSTP*PRTTCW 
ECRQVDPVQRPDQERRAG 
NVGKST LFNALTKNDVL A 

GVVREGRDLGVDTDHAD G 
AL*GNAVI SGLTPTTPTG 
PWSGTRWSRAWRRHRPRG 

GCC GGT TGA TGG GCA AGC GGT GCT AGC TCG GGT TGC AGC CAC AGC ACC CGC AGG 
1683 1692 1701 1710 1719 1728 

CGG CCA ACT ACC CGT TCG CCA CGA TCG AGC CCA ACG TCG GTG TCG TGG GCG TCC 

RPTTRSPRSSPTSVSWAS 
GQLPVRHDRAQRRCRGRP 
ANYPFAT IEPNVGVVGVP 

VCAEGLQGLDEGGLADER 
SARRVLNASIKEEWRMRG 
RRVG*WTPRSRRRGACGG 

GGC TGC GTG CGG AGT GGT TCA ACC GGC TCT AGA AGA GGA GGG TCG CGT AGG AGG 
1737 1746 1755 1764 1773 1782 

CCG ACG CAC GCC TCA CCA AGT TGG CCG AGA TCT TCT CCT CCC AGC GCA TCC TCC 

PTHASPSWPRSSPPSASS 
RR TPHQVGRDLL L PAHP P 
D A ~R LTKLAEIFSSQRI LP 
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RGDVEDVDGADHAAGGLP 
AVTSKTSMAPMTRPAESP 
PSRRSRRCRRCRARRRRp 

GCC GCT GGC AGC TGA AGC AGC TGT AGC GGC CGT AGC ACG CGC CGC GGA GGC TCC 
1791 1800 1809 1818 1827 1836 

CGG CGA CCG TCG ACT TCG TCG ACA TCG CCG GCA TCG TGC GCG GCG CCT CCG AGG 

RRPSTSSTSPASCAAPPR 
GDRRLRRHRRHRARRLRG 
ATVDFVDIAGIVRGASEG 

LAQAVLEERVDTLGVRDA 
SPRPLLNRAFMRSD SAI Q 
PPG-PCCTGRSCGHTRRSR 

CCC TCC CGG ACC CGT TGT TCA AGG AGC GCT TGT AGG CAC TCA GGC TGC GCT AGA 
1845 1854 1863 1872 1881 1890 

GGG AGG GCC TGG GCA ACA AGT TCC TCG CGA ACA TCC GTG AGT CCG ACG CGA TCT 

GRAWATSSSRTSVSPTRS 
GGPGQQVPREHP*VRRDL 
EGLGNKFLANIRE'S DAI C 

LDDAGELVLVDDMDVALD 
WTMRAKLSSFTTWT SPL T 
GP*GRR*PRSRRGHRRCP 

CGG TCC AGT AGG CGC GGA AGT TCC TGC TCT TGC AGC AGG TAC AGC TGC CGT TCC 
1899 1908 1917 1926 1935 1944 

GCC AGG TCA TCC GCG CCT TCA AGG ACG AGA ACG TCG TCC ATG TCG ACG GCA AGG 

ARSSAPSRTRTS SMS TAR 
PGHPRLQGRERRPCRRQG 
QVIRAFKDENVVHVDGKV 

RGLVVDLRDVGLQDERVE 
EGLSSMSVILVSSIRASR 
RAWPRCRSS*CRASGRPG 

AGA GCG GGT TCC TGC TGT AGC TCT GCT AGT TGT GGC TCG ACT AGG AGC GCC TGG 
1953 1962 1971 1980 1989 1998 

TCT CGC CCA AGG ACG ACA TCG AGA CGA TCA ACA CCG AGC TGA TCC TCG CGG ACC 

SRPRTTSRRSTPS*S SRT 
LAQGRHRDDQHRADPRGP 
SPKDDIETINTELI LADL 

LRDLLDQGAELLVRPDLL 
WVI S FTRGRRWFSER I L F 
GSSRSPGAGGGSPSAS*S 

AGG TCT GCT AGC TCT TCC AGG ACG GGG CGG AGG TCT TCC TGA GCG CCT AGT TCT 
2007 2016 2025 2034 2043 2052 

TCC AGA CGA TCG AGA AGG TCC TGC CCC GCC TCC AGA AGG ACT CGC GGA TCA AGA 
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PDDREGPAPPPEGLADQE 
Q TIEKVLPRLQKDSR I KK 

VERRLHLGDLLGLLDQLP 
SRAGFTFATSSALSIRSL 
PGRASPSPRRPPWPSGPS 



TCC TGG AGC GCG GCT TCC ACT TCC GGC AGC TCC TCC GGT TCC TCT AGG ACC TCT 
2061 2070 2079 2088 2097 2106 

AGG ACC TCG CGC CGA AGG TGA AGG CCG TCG AGG AGG CCA AGG AGA TCC TGG AGA 



RT SRRR*RPSRRPRR S WR 
GPRAEGEGRRGGQGDP GE 
DLAPKVKAVEEAKE I LER 

AVGEEGVADDLAGLAVLE 
PSVRKAWPMTWPVSRL S S 
PRCGRRGRCRGPCRACRA 



CCC CGC TGT GGG AGA AGC GGG TGC CGT AGC AGG TCC CGT GGC TCG CGT TGC TCG 
2115 2124 2133 2142 2151 2160 

GGG GCG ACA CCC TCT TCG CCC ACG GCA TCG TCC AGG GCA CCG AGC GCA ACG AGC 



GATPSSPTASSRAPSATS 
G R H P LRPRHRPGHRAQR A 
GDTLFAHGIVQGTERNEL 

QVVQVQEGGLGEEVDEVD 
RCSRCRSVVLGKR*TKIiT 
GARGAGA *WWARGRRR * R 



AGG ACG TGC TGG ACG TGG ACG AGT GGT GGT TCG GGA AGG AGA TGC AGA AGT TGC 
2169 2178 2187 2196 2205 2214 

TCC TGC ACG ACC TGC ACC TGC TCA CCA CCA AGC CCT TCC TCT ACG TCT TCA ACG 

SCTTCTCSPPSPSSTSST 
PAR PAPAHHQALPLR L QR 
LHDLHLLTTKPFLYVFNV 

VLVLQDVLVELVLLAG QD 
SSSSSI SSSKLFSCRART 
RRPRASRRPS*SRAAR GP 



AGC TGC TCC TGC TCG ACT AGC TGC TCC TGA AGT TCT TGC TCG TCG CGC GGG ACC 
2223 2232 2241 2250 2259 2268 

TCG ACG AGG ACG AGC TGA TCG ACG AGG ACT TCA AGA ACG AGC AGC GCG CCC TGG 



STRTS*STRTSRTSSAPW 
RRGRADRRGLQERAARPG 
DEDELI DEDFKNEQRALV 

GGGLGDEEVGLQLGVEGL 
AGASAMKRLALS SASRAS 
RGRR PWRG*RWAPPR GRR 

AGC GGG GGC GGC TCC GGT AGA AGG AGT TGC GGT TCG ACC TCC GGC TGG AGC GGC 
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2277 2286 2295 2304 2313 2322 

TCG CCC CCG CCG AGG CCA TCT TCC TCA ACG CCA AGC TGG AGG CCG ACC TCG CCG 



SPPPRPSSSTPSWRPTSP 
RPRRGHLPQRQAGGRPRR 
APAEAI FLNAKLEADLAE 

EVVVLGEFEELGDALVLG 
SSSSSARSSRWDTPWSSG 
ARRRRP GRVGGTRRGPRA 



TCG AGC TGC TGC TGC TCC GGG AGC TTG AGG AGG TCA GGC AGC CGG TCC TGC TCG 
2331 2340 2349 2358 2367 2376 

AGC TCG ACG ACG ACG AGG CCC TCG AAC TCC TCC AGT CCG TCG GCC AGG ACG AGC 



SSTTTRPSNSSSPSARTS 
ARRRRGPRTPPVRRP GRA 

LDDDEALELLQSVGQDEP 

AEGGE GADAEVGEAQ L GV 
PRAVRARTPKLVRPRCV * 
RGRWGRGRRS*CGRGAS R 



GGC CGG AGC GGT GGG AGC GGG CGC AGC CGA AGT TGT GGG AGC CGG ACG TCT GGA 
2385 2394 2403 2412 2421 2430 

CCG GCC TCG CCA CCC TCG CCC GCG TCG GCT TCA ACA CCC TCG GCC TGC AGA CCT 



PA S P P S PASAS TP SA C R P 
RPRHPRPRRLQHPRPADL 
GLATLARVGFNTLGLQTY 

QRGARLFGAGPGDLLAGG 
RVAPGF SDRAQVMLF PAV 
GSPRGSPI-GRRSW*SPRW 



TGG ACT GCC GGC CGG GCT TCC TTA GGG CGC GGA CCT GGT AGT TCT TCC CGC GGT 
2439 2448 2457 2466 2475 2484 

ACC TGA CGG CCG GCC CGA AGG AAT CCC GCG CCT GGA CCA TCA AGA AGG GCG CCA 



T*RPARRNPAPGPSRRAP 
PDGRPE GIPRL DHQE GR H 
LTAGPKESRAWT IKKGAT 

GGLGGADDVGVELLAEDL 
AGSAAPTMWVSKWFPKML 
RGRPRRR*GCRSGSP S * * 



GGC GGG GGC TCC GGC GGC CGC AGT AGG TGT GGC TGA AGG TCT TCC CGA AGT AGT 
2493 2502 251 1 2520 2529 2538 

CCG CCC CCG AGG CCG CCG GCG TCA TCC ACA CCG ACT TCC AGA AGG GCT TCA TCA 



PPPRPPASSTPTSRRAS S 
RPRGRRRHPHRLPEGLHQ 
APEAAGVIHTDFQKGF I K 

RL DDGEGVQHLGAGDGL G 
AS TMEKVSRTSVPETAS A 
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TCC GCC TCC AGT AGA GGA AGT GGC TGG ACC ACC TCT GGC CGA GGC AGC GGC TCC 
2547 2556 2565 2574 2583 2592 

AGG CGG AGG TCA TCT CCT TCA CCG ACC TGG TGG AGA CCG GCT CCG TCG CCG AGG 

RR RSSPSPTWWRPAPSPR 
GGGHLLHRPGGDRLRRRG 
AEVISFTDLVETGSVAEA 

ARLPLRTHLALVI HHLVP 
RAFPFARISPLS*T ICSP 
GRSPS PAYPPCPSHSAPR 

GGG CGC GCT TCC CCT TCC GCG CAT ACC TCC CGT TCC TGA TAC ACT ACG TCC TGC 
2601 2610 2619 2628 2637 2646 

CCC GCG CGA AGG GGA AGG CGC GTA TGG AGG GCA AGG ACT ATG TGA TGC AGG ACG 

PARRGRRVWRARTM*CRT 
PREGEGAYGGQGLCDAGR 
RAKGKARMEGK DYVMQDG 

VHDLEAEVHLRLEVVVS S 
STTSNRKLTYACNWWSAA 
PRPRTGS *RTPAI GGRRQ 

CCC TGC ACC AGC TCA AGG CGA AGT TGC ACA TCC GCG TTA AGG TGG TGC TGC GAC 
2655 2664 2673 2682 2691 2700 

GGG ACG TGG TCG AGT TCC GCT TCA ACG TGT AGG CGC AAT TCC ACC ACG ACG CTG 

GTWSSSASTCRRNSTTTL 
GRGRVP LQRVGAI PPRRC 

DV VEFRFNV*AQFHHDAA 

EFACTLLPRSRWPAAGQQ 
KLRAP* FPDVGGPPPGKS 
K*VRLDSPTSEELPRGRA 

GAA AGT TTG CGC GTC CAG TCT TCC CCA GCT GAG GAG GTC CCC CGC CGG GGA ACG 
2709 2718 2727 2736 2745 2754 

CTT TCA AAC GCG CAG GTC AGA AGG GGT CGA CTC CTC CAG GGG GCG GCC CCT TGC 

LSNAQVRRGRLLQGAAPC 
FQTRRSEGVDSSRGRPLA 
FKRAGQKGSTPPGGGPLL 

KGHQSPAPFAS*GDTKAR 
NGTSPHHQSLQDDMLRQG 
TERAPI TSPFSIMW*DKG 

ACA AAG GGC ACG ACC CTA CCA CGA CCC TTT CGA CTA GTA GGT AGT CAG AAA CGG 
2763 2772 2781 2790 2799 2808 

TGT TTC CCG TGC TGG GAT GGT GCT GGG AAA GCT GAT CAT CCA TCA GTC TTT GCC 

CFPCWDGAGKADHP SVFA 
VS^RAGMVLGKLI IHQSLP 
FPVLGWCWES*SSISLCP 
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GSSTLLPVNNPVVQPFPD 
APPH* SHYTILYWKL SPT 
QRLIDLTTR**TGSSPLP 

GAC GGC CTC CTA CAG TTC TCA CCA TGC AAT AAT CCA TGG TGA ACT CCC TTC CCC 
2817 2826 2835 2844 2853 2862 

CTG CCG GAG GAT GTC AAG AGT GGT ACG TTA TTA GGT ACC ACT TGA GGG AAG GGG 

LPEDVKSGTLLGT T * GKG 
C RRMSRVVRY*VP L E G RG 
AGGCQEWYVIRYHLREGV 

F*TSLGRAFGCPEREAS* 
SDHRYVALSAALSEKRQD 
R I M D I FRSRLRLARK GS I 

AGC TTA GTA CAG CTA TTT GGC GCT CGC TTC GGC GTT CCG AGA GAA AGG CGA CTA 
2871 2880 2889 2898 2907 2916 

TCG AAT CAT GTC GAT AAA CCG CGA GCG AAG CCG CAA GGC TCT CTT TCC GCT GAT 

SNHVDKPRAKPQGSL SAD 
R I (m) SINRERSRKALFPLI XZ 
ESCR*TASEAARLSFR*S 

==> 

SP*RCDRPWRSRRWARCR 
LLDVVIVLGDLDDGLVAV 
LFTLSL* SAMSITELCPL 

GTT CTT CCA GTT GCT GTT AGT GCT CCG GTA GCT CTA GCA GAG GTT CGT GCC GTT 
2925 2934 2943 2952 2961 2970 

CAA GAA GGT CAA CGA CAA TCA CGA GGC CAT CGA GAT CGT CTC CAA GCA CGG CAA 

QEG QRQ SRGHRDRLQARQ 
KKVNDNHEAIE IVS KH GN 
RR STTITRPSRSSP STAT 

RVRRPRPNHLAARP STGA 
GYEDRGL I ICRQALARVQ 
ATSTEASS*AASRSPEYR 

GCG GCA TGA GCA GAG CCG GCT CCT AAT ACG TCG CGA CGC GCT CCC GAG CAT GGA 
2979 2988 2997 3006 301 5 3024 

CGC CGT ACT CGT CTC GGC CGA GGA TTA TGC AGC GCT GCG CGA GGG CTC GTA CCT 

RRTRLGRGLCSAARGLVP 
AVLVSAEDYAALREGSYL 
PYSSRPRIMQRCARARTC 

ASEPSRGDVA*PTR SRGQ 
QARRRVGTSQELRVLVGK 
SREGAFARRSSLAYS FAR 

CGA CGC GAG AGG CCG CTT GCG GGC AGC TGA CGA GTT CCG CAT GCT CTT GCG GGA 
3033 3042 3051 3060 3069 3078 

GCT GCG CTC TCC GGC GAA CGC CCG TCG ACT GCT CAA GGC GTA CGA GAA CGC CCT 



- 12- 



A A E» S G E* R P" S T A Q G V : R E R P 
LRSPANARRLLKAYENAL 
CALRRTPVDCSRRTRTPL 

GR*HTPAPASRDPNPPRQ 
GVDIHRLPLQDIRIRRVS 
AWTLTDSRSSISGSEASA 



ACG GGT GCA GTT ACA CAG CCT CGC CCT CGA CTA GCT AGG CCT AAG CCG CCT GCG 
3087 3096 3105 3114 3123 3132 

TGC CCA CGT CAA TGT GTC GGA GCG GGA GCT GAT CGA TCC GGA TTC GGC GGA CGC 



CPRQCVGAGADRSGFGGR 
AHVNVSERELIDPDSADA 
PTSMCRSGS*SIRIRRTL 

NPHRTLSTKSS*PQSS*V 
TRTGRSAQRRPDPSPHSC 
PEPAAHPKDELI LAP IVV 



ACC AAG CCC ACG GCG CAC TCC GAA CAG AAG CTC CTA GTC CCG ACC CTA CTG ATG 
3141 3150 3159 3168 3177 3186 

TGG TTC GGG TGC CGC GTG AGG CTT GTC TTC GAG GAT CAG GGC TGG GAT GAC TAC 

W F G C R (v) RLVFEDQGWDDYV 
GSGAA*GLSSRIRAGMTT 
VRVPREACLRGSGLG* LH 



DQSL FSRLISARMLL SMS 
T R A * SRGCSARGC*CA*R 
RGPELVVALHEGADVLED 



TGC AGG ACC GAG TTC TTG CTG GCG TTC TAC GAG CGG GCG TAG TTG TTC GAG TAG 
3195 3204 3213 3222 3231 3240 

ACG TCC TGG CTC AAG AAC GAC CGC AAG ATG CTC GCC CGC ATC AAC AAG CTC ATC 



TSWLKNDRKMLARI NKL I 
RPGSRTTARCSPASTSS S 
VLAQERPQDARPHQQAHR 

STLR SGKVPIPLGSGSFY 
PR*ARGR*PSRCVRAAS T 
LVDPAVGERPDAFGLRQL 



CTC CTG CAG TCC GCG CTG GGG AAG TGC CCC TAG CCG TTT GGG CTC GGC GAC TTC 
3249 3258 3267 3276 3285 3294 

GAG GAC GTC AGG CGC GAC CCC TTC ACG GGG ATC GGC AAA CCC GAG CCG CTG AAG 



EDVRRDPFTGIGKPEPLK 
RTSGATPSRGSANPSR* S 
GRQARPLHGDRQTRAAEV 

WKGPAHDRRI SSSCRRTY 
GSAP PTTAASRRRVGGRT 
VVQRPRPRPPDYVFVAEH 



ATG GTG AAC GGC CCC CGC ACC AGC GCC GCC TAG CTG CTG CTT GTG GCG GAG CAC 
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3303 33T2 3321 3330 3339 3348 

TAC CAC TTG CCG GGG GCG TGG TCG CGG CGG ATC GAC GAG GAA CAC CGC CTC GTG 



YHLPG AWSRRIDDEHRL V 
TTCRGRGRGGSTTNTAS C 
PLAGGVVAADRRRTPPRV 

RTVSLS ITIRAARYW*Q S 
GP*PCPSRSGRQGTGS SV 
VQNRVLLDHDESGPVVVS 



ATG GAC CAA TGC CTG TTC CTC TAG CAC TAG GAG CGA CGG GCC ATG GTG ATG ACT 
3357 3366 3375 3384 3393 3402 

TAC CTG GTT ACG GAC AAG GAG ATC GTG ATC CTC GCT GCC CGG TAC CAC TAC TGA 



YLVTDKE IVILAARY HY * 
TWLRTRRS*SSLPGTTTD 
PGYGQGDRDPRCPVPLLT 

GLHDERAPITSPHAGRVR 
AWTTRGHQSPAPIPGEFG 
QGPPGGTSPHHQSPGRSG 



GAC GGG TCC ACC AGG AGG GCA CGA CCC TAC CAC GAC CCT ACC CGG GGA GCT TGG 
3411 3420 3429 3438 3447 3456 

CTG CCC AGG TGG TCC TCC CGT GCT GGG ATG GTG CTG GGA TGG GCC CCT CGA ACC 



LPRWSSRAGMVLGWAPRT 
CPGGPPVLGWCWDGPLEP 
AQVVLPCWDGAGMGPSNP 

HKRLHSSQL*HEAEVNLR 
INGCTPARYNINRKLT * A 
STEAPP LETTLTGS*RKP 



GCT ACA AAG GCG TCC ACC CTC GAG ACA TCA ATT ACA AGG CGA AGT TGC AAA TCC 
3465 3474 3483 3492 3501 3510 

CGA TGT TTC CGC AGG TGG GAG CTC TGT AGT TAA TGT TCC GCT TCA ACG TTT AGG 



RCFRRWELCS*CSASTFR. 
DVSAGGSSVVNVPLQRLG 
MFPQVGAL*LMFRFNV*A 

LDVVDDQQIRLDSPDSED 
CIWWTTKNFACTLPTRSM 
ASGGRRRTSHAP*LPGV* 



GCG TCT AGG TGG TGC AGC AGA ACA ACT TAC GCG TCC AGT CTC CCC AGG CTG AGT 
3519 3528 3537 3546 3555 3564 

CGC AGA TCC ACC ACG TCG TCT TGT TGA ATG CGC AGG TCA GAG GGG TCC GAC TCA 



RRSTTS SC*MRRSEGSD S 
ADPPRRLVECAGQRGPTH 
QIHHVVLLNAQVRGVRL I 

SD PGQSKGTGGASQSN S L 
PT PGRARERAEPLSPTA * 
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AGC CTC AGC CCG GGG ACC GAG AAA GGG CAC GGA GGC CGT CTG ACC CTC AAC GAG 
3573 3582 3591 3600 . 3609 3618 

TCG GAG TCG GGC CCC TGG CTC TTT CCC GTG CCT CCG GCA GAC TGG GAG TTG CTC 

SESGPWLFPVPPADWELL 
RSRAPGSFPCLRQTG-SCS 
GVGPLALSRASGRLGVAQ 

**RGI PCYPGTWLALASW 
DDGASRATPGQGSRWRPG 
TMVQRDPL LARDLAG ARV 

TCA GTA GTG GAC GGC TAG CCC GTC ATC CCG GGA CAG GTC TCG CGG TCG CGC CTG 
3627 3636 3645 3654 3663 3672 

AGT CAT CAC CTG CCG ATC GGG CAG TAG GGC CCT GTC CAG AGC GCC AGC GCG GAC 

SHHLPI GQ*GPVQSASAD 
VITCRSGSRALSRAPART 
SSPADRAVGPCPERQRGP 

NSPIMQRDTGTLIEADAH 
TPLS*RATRVPSSRPTPT 
LQFPDDPPG YRHPDRRRR 

GTC AAC CTT CCC TAG TAG ACC GCC AGG CAT GGC CAC TCC TAG AGC CGC AGC CGC 
3681 3690 3699 3708 3717 3726 

CAG TTG GAA GGG ATC ATC TGG CGG TCC GTA CCG GTG AGG ATC TCG GCG TCG GCG 

QLEGI IWRSVPVRISASA 
SWKGS SGGPYR*GSRRRR 
VG RDHLAVRTGEDLGVGV 

TGFRALTFCHAGGSFCFE 
PASAPWPSATPAAPSASS 
PHRLP GPHLLPRRRL L LV 

ACC CAC GGC TTC GCC CGG TCC CAC TTC GTC ACC CGC GGC GGC CTC TTC GTC TTG 
3735 3744 3753 3762 3771 3780 

TGG GTG CCG AAG CGG GCC AGG GTG AAG CAG TGG GCG CCG CCG GAG AAG CAG AAC 

WVPKRARVKQWAPPEKQN 
GCRSGPG*SSGRRRRSRT 
GAEAGQGEAVGAAGEAEL 

SAPPLDGIRERFTARRGV 
APRPCTASANASRPADA* 
RQGPAPRRHTRPVHRT PR 

AGC GAC CGG CCC CCG TCC AGC GGC TAC GCA AGC GCC TTG CAC CGC GCA GCC GGA 
3789 3798 3807 3816 3825 3834 

TCG CTG GCC GGG GGC AGG TCG CCG ATG CGT TCG CGG AAC GTG GCG CGT CGG CCT 

SLAGGRSPMRSRNVARRP 
RW PGAGRRCVRGTWRVGL 
A G R GQVADAFAERGASAY 
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GILWAATLRSRWEYGLLA 
AS*GPPPSAHAGSTAS SP 
RRDALRRHPTLAVRLRPp 

TGC GGC TAG TCG GTC CGC CGC CAC TCC GCA CTC GCG GTG AGC ATC GGC TCC TCC 
3843 3852 3861 3870 3879 3888 

ACG CCG ATC AGC CAG GCG GCG GTG AGG CGT GAG CGC CAC TCG TAG CCG AGG AGG 

TPI SQAAVRRERHS * P R R 
RRSARRR*GVSATRSRGG 
ADQPGGGEA*APLVAE'E G 

EWEAHTITAADDI LHRTF 
RGSPMPSRPQTTSSTVPS 
GGVRCPHDHSRRRHPSPH 

CGG AGG GTG AGC CGT ACC CAC TAG CAC CGA CGC AGC AGC TAC TCC ACT GCC CAC 
3897 3906 3915 3924 3933 3942 

GCC TCC CAC TCG GCA TGG GTG ATC GTG GCT GCG TCG TCG ATG AGG TGA CGG GTG 

ASHSAWVIVAASSM R*RV 
PPTRHG*SWLRRR*GDG* 
LPLGMGDRGCVVDEVTGE 

REAHPWGPRLVRGSKLDR 
ANPTPGGPGCSAVAK* TA 
LTRRPAVRAAPRSRKEPR 

TTC GCA AGC CGC ACC CCG GTG GGC CCG GCG TCC TGC GCT GGC GAA AAG TCC AGC 
3951 3960 3969 3978 3987 3996 

AAG CGT TCG GCG TGG GGC CAC CCG GGC CGC AGG ACG CGA CCG CTT TTC AGG TCG 

KRSAWGHPGRRTRPLFRS 
SVRRGATRAAGRDRF SGR 
AFGVGPPGPQDATAFQVA 

CRPRD S DKSTVYRE IVYG 
AARATRTRAR*TAS S * T A 
PLAPPGLGQEDRLARDRL 

GCC GTC GCG CCC GCC AGG CTC AGG AAC GAG CAG TGC ATC GCG AGC TAG TGC ATC 
4005 4014 4023 4032 4041 4050 

CGG CAG CGC GGG CGG TCC GAG TCC TTG CTC GTC ACG TAG CGC TCG ATC ACG TAG 

RQRGRS E SLLVT*RS I t * 
GSAGGPSPCSSRSARSRS 
AARAVRVLARHVALDHVA 

YGSEESHQFPMPWREPYL 
TAARRPT S SRCRGGRRTC 
RLREGRLAPVADAVE GPV 

GGC ATC GGC GAG AGG AGC CTC ACG ACC TTG CCG TAG CCG GTG GAG AGG CCC ATG 
4059 4068 4077 4086 4095 4104 

CCG TAG CCG CTC TCC TCG GAG TGC TGG AAC GGC ATC GGC CAC CTC TCC GGG TAC 
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P * P Ei S S K C W 1ST G I G H L S G Y 
RSRSPRSAGTASATSPGT 
VAALLGVLERHRPPLRVQ 

DTRDIWTPAVFI S GGVPA 
IPVTSGPPPSSSAAASPP 
SRYPRDLHP RRLHQRRRp 

TCT AGC CAT GCC AGC TAG GTC CAC CCC CGC TGC TTC TAC GAC GGC GGC TGC CCC 
4113 4122 4131 4140 4149 4158 

AGA TCG GTA CGG TCG ATC CAG GTG GGG GCG ACG AAG ATG CTG CCG CCG ACG GGG 

RSVRS IQVGATKMLPP TG 
DRYGRSRWGRRRCCRRRG 
IGTVDPGGGDEDAAADGG 

ESAELLSWTHSEEVLHEW 
KPPKWCP6PTPSKSWTN6 
SRLSGAPVLHPVRRGP TG 

CGA AGC CTC CGA AGG TCG TCC CTG GTC CAC ACC CTG AGA AGC TGG TCC ACA AGG 
4167 4176 4185 4194 4203 4212 

GCT TCG GAG GCT TCC AGC AGG GAC CAG GTG TGG GAC TCT TCG ACC AGG TGT TCC 

ASEASSRDQVWDSSTRCS 
LRRLPAGTRCGTLRPGVP 
FGGFQQGPGVGLFDQVFP 

PASWDLEWDLGTGS I GYT 
PRAGtSNGTWAPAPSATR 
LARELRTGLGPRHRLHRV 

GTC CCG CGC GAG GTC AGC TCA AGG GTC AGG TCC GGC CAC GGC CTC TAC GGC ATG 
4221 4230 4239 4248 4257 4266 

CAG GGC GCG CTC CAG TCG AGT TCC CAG TCC AGG CCG GTG CCG GAG ATG CCG TAC 

QGALQSSSQSRPVPEMPY 
RAR S S RVP S PGR C RR C R T 
GRAPVE FPVQAGAGDAVR 



RDADVRWFRSHL I (v) Q A H D 
A TPTWGGSGPTSS * K P T T -V^ 
HPRRGGALVPLPPD SPRP 

CAC GCC AGC CGC AGG TGG GCG GTC TTG GCC CTC ACC TCC TAG TGA ACC CGC ACC 
4275 4284 4293 4302 4311 4320 

GTG CGG TCG GCG TCC ACC CGC CAG AAC CGG GAG TGG AGG ATC ACT TGG GCG TGG 

VRSASTRQNREWR I TWAW 
CGRRPPARTGSGGSLGRG 
AVGVHPPEPGVEDHLGVV 

ALDNI IETFHAPASNP*P 
PWTTSSRPSTPPRRTRDP 
RGPRQHDRHLPRAGLETL 



AGC CGG TCC AGC AAC TAC TAG AGC CAC TTC ACC CGC CCG CGG CTC AAG CCA GTC 
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4329 4338 4347- 43S6~ 4365 4374 

TCG GCC AGG TCG TTG ATG ATC TCG GTG AAG TGG GCG GGC GCC GAG TTC GGT CAG 



SARS LM I SVKWAGAE F GQ 
R PGR**SR*SGRAPSSVR 
GQVVDDLGEVGGRRVRSG 

GAGMGQRQPR*RGAPRDP 
GRAWERVSPDDADLLAI L 
AGRGNGSAPTTLTWCPS* 



CCG GGG CGC GGG TAA GGG ACT GCG ACC CCA GCA GTC GCA GGT CGT CCC GCT AGT 
4383 4392 4401 4410 4419 4428 

GGC CCC GCG CCC ATT CCC TGA CGC TGG GGT CGT CAG CGT CCA GCA GGG CGA TCA 



GPAP IP *RWGRQRPAGR S 
APRPFPDAGVVSVQQGDQ 
PRAHSLTLGSSAS SRAIR 

RPLLTPRSGRRLGRHRDA 
APCCRPDAVEEFVE I ATL 
PPAAAHTQ*RKSSRSPP* 



CCC GCC CCG TCG TCG CAC CCA GAC GAT GGA GAA GCT TCT GGA GCT ACC GCC AGT 
4437 4446 4455 4464 4473 4482 

GGG CGG GGC AGC AGC GTG GGT CTG CTA CCT CTT CGA AGA CCT CGA TGG CGG TCA 



GRGS SVGLLPLRRPRWRS 
GGAAAWVCYLFEDLD GGQ 
AGQQRGSATSSKT SMAVS 

PRLQGPYAARRHDYPNR* 
RGFSGLTPLGGIITL IAD 
GASAAWPLCGASSRL SQT 



CGG CCG GCT TCG ACG GGT CCC ATC CGT CGG GCG GCT ACT AGC ATT CCT AAC GCA 
4491 4500 4509 4518 4527 4536 

GCC GGC CGA AGC TGC CCA GGG TAG GCA GCC CGC CGA TGA TCG TAA GGA TTG CGT 



AGRSCPG*AARR*S*GLR 
PAEAAQGRQPADDRKDCV 
RPKLPRVGSPPMIVRIAS 

SRHRGAARPRRI LRRRRR 
RGIDVLQARAAYSADDDG 
VVSTSWSRAPPTHPTTTA 



GTG CTG GCT ACA GCT GGT CGA CGC GCG CCC GCC GCA TAC TCC GCA GCA GCA GCG 
4545 4554 4563 4572 4581 4590 

CAC GAC CGA TGT CGA CCA GCT GCG CGC GGG CGG CGT ATG AGG CGT CGT CGT CGC 



HDRCRPAARGRR MRRRRR 
TTDVDQLRAGGV*GVVVA 
RPMS TSCARAAYEAS S SP 

RA_APRPDRHPPDHHAPHG 
DL QQVLTEIHPTTTRRTA 
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GCA GCT CGA CGA CCT GCT CCC AGA GCT ACA CCC CCC AGC ACC ACG CGG CCC ACC 
4599 4608 4617 4626 4635 4644 

CGT CGA GCT GCT GGA CGA GGG TCT CGA TGT GGG GGG TCG TGG TGC GCC GGG TGG 

RRAAGRGSRCGGSWCAGW 
VELLDEGLDVGGRGAPGG 
SSCWT'RVSMWGVVVRRVA 

HRWLHPAVLLAGPPRRAV 
MVGSTPLWWCLAPRDDPW 
W SALP P S GGASRRAT T P G 

GGT ACT GCG GTC TCC ACC CCT CGG TGG TCG TCT CGC GGC CCG CCA GCA GCC CGG 
4653 4662 4671 4680 4689 4698 

CCA TGA CGC CAG AGG TGG GGA GCC ACC AGC AGA GCG CCG GGC GGT CGT CGG GCC 

p*RQRWGATSRAPGGRRA 
HDARGGEPPAERRAVVGP 
MTPEVGSHQQSAGRS SGH 

) PRPGRSGPRRLPRTD PRR 

PARDEAAR DEFPART LDV 
RPATRPQGTKSPPAH * T S 

TGC CCC GCG CCA GGA GCC GAC GGG CCA GAA GCT TCC CCC GCG CAC AGT CCA GCT 
4707 4716 4725 4734 4743 4752 

ACG GGG CGC GGT CCT CGG CTG CCC GGT CTT CGA AGG GGG CGC GTG TCA GGT CGA 

TGRGPRLPGLR RGRVS GR 
RGAVLGCPVFEGGACQ V D 
GARSSAARSSKGARVR ST 

PALRPRAARGRGAPPRVA 
PRWAPDLPEDEAPPR VY R 
PAGPPTSRSTRPRRASTG 

GCC CCG CGG TCC GCC CCA GCT CGC CGA GCA GGA GCC GGC CGC CCG CCT GCA TGG 
J 4761 4770 4779 4788 4797 4806 

CGG GGC GCC AGG CGG GGT CGA GCG GCT CGT CCT CGG CCG GCG GGC GGA CGT ACC 

RGAR R G R A A R P R P A G G R T 
GAPGGVERLVLGRRADVP 
GRQAGS SGSSSAGGR TYR 



sraprlacqdravdrcgg 
rghqacpanighst(v)aag x£ 
gvtspaprmsgtrr* plg 

cgg ctg gca cga ccc gcg tcc cgc gta act agg gca cgc tgc agt gcc gtc ggg 

4815 4824 4833 4842 4851 4860 

GCC GAC CGT GCT GGG CGC AGG GCG CAT TGA TCC CGT GCG ACG TCA CGG CAG CCC 

ADRAGRRAH*SRAT SRQP 
PT.VLGAGRIDPVRRHGSP 
R P C WAQGALIPCDVTAAP 
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PRG*PPARL*KTLALLPL 
QGAELRPACDNQLHWSRF 
RAPRLAPRAT MKYTGPA S 

GGA CCG GCC GGA GTT CCG CCC CGC GCG TCA GTA AAA CAT TCA CGG TCC TCG CCT 
4869 4878 4887 4896 4905 4914 

CCT GGC CGG CCT CAA GGC GGG GCG CGC AGT CAT TTT GTA AGT GCC AGG AGC GGA 

PGRPQGGARSHFVSAR S G 
LAGLKAGRAVIL * V P G A E 
WPASRRGAQSFCKCQERK 

YAGEFPL IVHLASAPP EA 
IPEKSHCS*TSLPRRRSP 
SLSRRIALDRPSRVGAAR 

TCT ATC CGA GGA AGC TTA CCG TTC TAG TGC ACC TCT CGC CTG CGG CCG CCG AGC 
4923 4932 4941 4950 4959 4968 

AGA TAG GCT CCT TCG AAT GGC AAG ATC ACG TGG AGA GCG GAC GCC GGC GGC TCG 

r*APSNGKITWRADAGGS 
D R L L R <M) ARSRGERTPAAR 
IGSFEWQDHVESGRRRLG 



S *RVCRENGATAPVARC G 
PDG*AVSTELLPLCQEA V 
RIVERLARKWCHCASSPL 

CGC CTA GTG GAG TGC GTT GCG AGC AAA GGT CGT CAC CGT CCG TGA CGA GCC GTT 
4977 4986 4995 5004 5013 5022 

GCG GAT CAC CTC ACG CAA CGC TCG TTT CCA GCA GTG GCA GGC ACT GCT CGG CAA 

ADHLTQRSFPAVAGTARQ 
RITSRNARFQQWQALLGN 
GSPHATLVSSSGRHCSAT 

CCACARRHTGPS PLGG S R 
AV. LARAGTLEQHHSDARD 
RLLRVRAPSNRT I PTRG I 

GGC GTT GTT CGC GTG CGC GCG GCC ACT CAA GGA CCA CTA CCC TCA GGC GGG CTA 
5031 5040 5049 5058 5067 5076 

CCG CAA CAA GCG CAC GCG CGC CGG TGA GTT CCT GGT GAT GGG AGT CCG CCC GAT 

PQQAHARR*VPGDGSPPD 
RNKRTRAGEFLVMGVRP I 
ATSARAPVSSW*WESARS 

ARP.PARSA RVCAGRRRVA 
RERHLVAPGYAREEVV S L 
ESATSCPQGTRVSR*SPC 

GAG CGA GCG CCA CCT CGT GCC GAC CGG GCA TGC GTG CGA GGA GAT GCT GCC TGT 
5085 5094 5103 51-1 2 51 21 51 30 

CTC GCT CGC GGT GGA GCA CGG CTG GCC CGT ACG CAC GCT CCT CTA CGA CGG ACA 
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A R G G A R Ii A R" T FT* A P L R R T 
;LAVEHGWPVRTLLYDGQ 
RSRWSTAGPYARSSTTDS 

PATSTPAPAEEYPASPAS 
>LQRLPRPLKKTRHPRLL 
SSDFHARSSRRVTRVSC 



CGC CCT CGA CAG CTT CAC CCG CGC CCT CGA AGA AGC ATG CCA CGC CTG CCT CGT 
5139 5148 5157 5166 5175 5184 

GCG GGA GCT GTC GAA GTG GGC GCG GGA GCT TCT TCG TAC GGT GCG GAC GGA GCA 



AGAVEVGAGASSYGADGA 
RELSKWARELLRTVRTEQ 
GSCRSGRGSFFVRCGRSR 

RSPGPGASPAPPSSRPGA 
DRHGRVQQHLQPLLVLGR 
IAIAGSRSISSPSFFSAG 



CTA GCG CTA CCG GGG CCT GGA CGA CTA CCT CGA CCC CCT CTT CTT GCT CCG GGG 
5193 5202 5211 5220 5229 5238 

GAT CGC GAT GGC CCC GGA CCT GCT GAT GGA GCT GGG GGA GAA GAA CGA GGC CCC 



DRD GP GPAD GAGGE ERGP 
IAMAPDLLMELGEK NEAP 
SRWPRTC*WSWGRRTRPR 

RPRRRRP SARRR GRG S GP 
GLDDGDH-LHGGVVEVPDR 
GSTTATTSIGASSRSRI G 



CGG GCT CCA GCA GCG GCA GCA CCT CTA CGG GCG GCT GCT GGA GCT GGC CTA GGG 
5247 5256 5265 5274 5283 5292 

GCC CGA GGT CGT CGC CGT CGT GGA GAT GCC CGC CGA CGA CCT CGA CCG GAT CCC 



ARGRRRRGDARRRPRPDP 
PEVVAVVEMPADDLDRI P 
PRSSPSWRCPPTTSTGSR 

GPPSGPRVTRGASWDPSC 
DPLVEQAYQEVPRGTRPV 
TRSSKRPTSNSRGVLGPF 



CCA GGC CCT CCT GAA GGA CCC GCA TGA CAA GCT GGC CGG CTG GTC AGG CCC CTT 
5301 5310 5319 5328 5337 5346 

GGT CCG GGA GGA CTT CCT GGG CGT ACT GTT CGA CCG GCC GAC CAG TCC GGG GAA 



GPGGLPGRTVRPADQ SGE 
VREDFLGVLFDRPTS PGN 
SGRT SWAYCSTGRPVRGT 

RCC*ESPPHGPRARASRP 
DAADNARRIGQARVPQDH 
MPLMMREASARPACP S I T 

GTA GCC GTC GTA GTA AGC GAG CCG CCT ACG GGA CCC GCG CGT GCC CGA CTA GCA 
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5355 5373 5382 5391 5400 

CAT CGG CAG CAT CAT TCG CTC GGC GGA TGC CCT GGG CGC GCA CGG GCT GAT CGT 



HRQHHSLGGCPGRARADR 
IGSI IRSADALGAHGL IV 
SAASFARRMPWARTG* SW 

PARRRRRRGSIPGT S CRS 
RPVGGVDVVRFRDPRAGA 
APCAAST*SGFDTRDLVP 



CCG CCC CGT GCG GCG GCT GCA GAT GCT GGG CTT TAG CCA GGC CAG CTC GTG GCC 
5409 5418 5427 5436 5445 5454 

GGC GGG GCA CGC CGC CGA CGT CTA CGA CCC GAA ATC GGT CCG GTC GAG CAC CGG 



GGARRRRLRPEIGPVEHR 
AGHAADVYDPKSVRS S TG 
RGTPPTST TRNRSGRAPA 

ATRGARRGPATVPRP SPS 
RQEGQGGDPHR*RALHHV 
ESNERGATRTGDGP S T I S 



GAG CGA CAA GAG GGA CGG GCG GCA GGC CCA CGG CAG TGG CCC GCT CCA CTA CCT 
5463 5472 5481 5490 5499 5508 

CTC GCT GTT CTC CCT GCC CGC CGT CCG GGT GCC GTC ACC GGG CGA GGT GAT GGA 



LAVLPARRPGAVTGRGDG 
SLFSLPAVRV PSPGEVMD 
RCSPCPPSGCRHRAR*WT 

PPPGGPRRCASRGPRYPR 
PHLGAPGGARRDDQDTRV 
QTSARRAAPVGITRTPVS 



GAC CCA CCT CCG GGC GGC CCG GCG GCC GTG CGG CTA GCA GGA CCA GCC ATG CCT 
5517 5526 5535 5544 5553 5562 

CTG GGT GGA GGC CCG CCG GGC CGC CGG CAC GCC GAT CGT CCT GGT CGG TAC GGA 



LGGGPPGRRHADRPGRYG 
WVEARRAAGTP IVLVGTD 
GWRPAGPPARRSSWSVRT 

ARRSRHTRSRS*GASGAA 
LVAVAI HEVEVEGLRGQQ 
SCPSQSTNSKSKVWGV RS 



GCT CGT GCC GCT GAC GCT ACA CAA GCT GAA GCT GAA GTG GGT CGG CTG GGA CGA 
5571 5580 5589 5598 5607 561 6 

CGA GCA CGG CGA CTG CGA TGT GTT CGA CTT CGA CTT CAC CCA GCC GAC CCT GCT 



RARRLRCVRLRLHPADPA 
EHGDCDVFDFDFTQPTLL 
STATAMCSTSTSPSRPCC 

S R NW C HSLRA*CRRAYTTRS 
QDAI LCGPEAVGPTRQAV 
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CGA CTA GCC GTT ACT CTG TCG GCC CGA GTC GTT GCG GAC CGC ATG CAA CAC GCT 
5625 5634 5643 5652 5661 5670 

GCT GAT CGG CAA TGA GAC AGC CGG GCT CAG CAA CGC CTG GCG TAC GTT GTG CGA 

ADRQ*DSRAQQRLAYVVR 
LIGNETAGLSNAWRT L CD 
* SAMRQPGSATPGVR CAT 

CP*CGSPRSRSSASRPSR 
VRDADRHGAGRARQVRRV 
*VTLMGIAPEALESFAAF 

GAT GTG CCA GTC GTA GGG CTA CCG GCC GAG GCG CTC GAG CGA CTT GCG CCG CTT 
5679 5688 5697 5706 5715 5724 

CTA CAC GGT CAG CAT CCC GAT GGC CGG CTC CGC GAG CTC GCT GAA CGC GGC GAA 

LHGQHPDGRLRELAERGE 
YTVS IPMAGSASSLNAAN 
TRSASRWPAPRAR* T RRT 

RSRSGRRLPVAAS*RFFR 
GRGRDEVFRYPLPDAS S G 
AAVAIR * SATRCRI LP LV 

GCG GCG CTG GCG CTA GGA GAT GCT TCG CCA TGC CGT CGC CTA GTC GCC TTC TTG 
5733 5742 5751 5760 5769 5778 

CGC CGC GAC CGC GAT CCT CTA CGA AGC GGT ACG GCA GCG GAT CAG CGG AAG AAC 

RRDRDPLRSGTAADQRKN 
AATA I LYEAVRQRI SGRT 
PRPR SSTKRYGSGSAEEP 

LLERLLRP YNYRARARDQ 
CCSGSCGPTTTGPGRGTR 
AVVGQAAPPLQVQGAGPG 

GCG TTG TTG AGG GAC TCG TCG GCC CCC ATC AAC ATG GAC CGG GCG CGG GCC AGG 
5787 5796 5805 5814 5823 5832 

CGC AAC AAC TCC CTG AGC AGC CGG GGG TAG TTG TAC CTG GCC CGC GCC CGG TCC 



(l) Y L A R A R S 



RNNSLSSRG 
ATTP *AAGGSCTWPAPGP 
QQLP EQPGVVV P^ G P R P V L 

IRGV I EAHREFDGA L .R GL 
SGGW SRRTGSSTAQWVAW 
PDAGRD GRAARLRRG S PG 

ACC TAG GCG GGG TGC TAG AGG CGC ACG GCG AGC TTC AGC GGA CGG TCT GCC GGG 
5841 5850 5859 5868 5877 5886 

TGG ATC CGC CCC ACG ATC TCC GCG TGC CGC TCG AAG TCG CCT GCC AGA CGG CCC 

WIRPTI SACRSKSPARRP 
GS APRSPRAARSRLPD GP 
D P P HDLRVPLEVACQTAQ 
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TAAPDSGLTLAEVDGEYV 
RPLPTRAWR*LRSTVRTC 
AHCRPGLGADSGRR* GRV 



TCG CAC CGT CGC CCC AGG CTC GGG TCG CAG TCT CGG AGC TGC AGT GGG AGC ATG 
5895 5904 5913 5922 5931 5940 

AGC GTG GCA GCG GGG TCC GAG CCC AGC GTC AGA GCC TCG ACG TCA CCC TCG TAC 

SVAAGSEPSV RASTSPSY 
AWQRGPSPASEPRRHPRT 
RGSGVRAQRQSLDVT LVH 

SSMFEAEPPLVPLSGSAL 
PPCSNRKPRCCRCPARRS 
RLVHI GSRAAAGAPL GVR 

TGC CTC CTG TAC TTA AGG CGA AGC CCG CCG TCG TGG CCG TCC CTC GGG CTG CGC 
5949 5958 5967 5976 5985 5994 

ACG GAG GAC ATG AAT TCC GCT TCG GGC GGC AGC ACC GGC AGG GAG CCC GAC GCG 

TEDMNSASGGSTGREPDA 
RRT* IPLRAAAPAGSPTR 
GGHE FRFGRQHRQGARRE 

TELMR ATFLGTDAVLPSV 
RKSCGPRSCGRTPWSRAS 
ANRAD P GHVAGHRGRAP Q 

TCG CAA AGC TCG TAG GCC CGG CAC TTG TCG GGG CAC AGC CGG TGC TCG CCC GAC 
6003 6012 6021 6030 6039 6048 

AGC GTT TCG AGC ATC CGG GCC GTG AAC AGC CCC GTG TCG GCC ACG AGC GGG CTG 

SVSSIRAVNSPVSATSGL 
AFRASGP *TAPCRPRAG * 
RFEHPGREQPRVGHERAD 

LVPT I VARGME T VVH G F P 
WCRRSSPGDWRPSSMDSR 
GAGAHHRGTGDRHRCTRV 

TGG TCG TGG CCG CAC TAC TGC CGG GCA GGG TAG AGC CAC TGC TGT ACA GGC TTG 
6057 6066 6075 6084 6093 6102 

ACC AGC ACC GGC GTG ATG ACG GCC CGT CCC ATC TCG GTG ACG ACA TGT CCG AAC 

TSTGVMTARPISVTTCPN 
PAPA**RPVPSR*RHVRT 
QHRRDDGPSHLGDDMSER 

VPPQVEVGS*GNRSGRLH 
CRRS SRSAAEATGAGAS T 
AGAAPGRRRKLREPERPP 



CCG TGG CCG CCG ACC TGG AGC TGC GGC 
6111 6120 6129 

GGC ACC GQQ GGC TGG ACC TCG ACG CCG 



GAA GTC GGC AAG GCC GAG GGC GCC TCC 
6138 6147 6156 

CTT CAG CCG TTC CGG CTC CCG CGG AGG 
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G' T" G' G" W T S" T F L Q* P F R £ P R R 
APAAGPRRRFSRSGSRGG 
HRRLDLDAASAVPAPAEV 



HGRLRPLDGRGVVARLGS 
IDEFGPCTEGDWWRGCVR 
STRSAPAPRGTGGGGASG 

ACT ACA GGA GCT TCG GCC CCG TCC AGA GGG GCA GGG TGG TGG CGG GCG TCT GGG 
6165 6174 6183 6192 6201 6210 

TGA TGT CCT CGA AGC CGG GGC AGG TCT CCC CGT CCC ACC ACC GCC CGC AGA CCC 

★ CPRSRGRSPRPTTARRP 

dvleagaglpvppppadp 

(m) sskpgqvspshhrp.qt r ^V- 

daaapgtqrggrgrhvae 

IRRLRAQRAAEVVEI fpk 
FGGCGPRDPPRWSRSSRS 

CTT AGG CGG CGT CGG CCC GGA CAG ACC GCC GGA GGT GCT GGA GCT ACT TGC CGA 
6219 6228 6237 6246 6255 6264 

) GAA TCC GCC GCA GCC GGG CCT GTC TGG CGG CCT CCA CGA CCT CGA TGA ACG GCT 

ESAAAGPVWRPPRPR* TA 
NPPQPGLSGGLHDLDERL 
IRRSRACLAASTTSM NGF 

VAGLQQRHVAARLGAGSR 
WRGWNSGIYQLEYDREPG 
GGGGTAASTSCSTTGSRV 

AGG TGG CGG GGG TCA ACG ACG GCT ACA TGA CGT CGA GCA TCA GGG CGA GGC CTG 
6273 6282 6291 6300 6309 6318 

TCC ACC GCC CCC AGT TGC TGC CGA TGT ACT GCA GCT CGT AGT CCC GCT CCG GAC 

STAPSCCRCTAARSPAPD 
PPPPVAADVLQL VVPLRT 
HRPQLLPMYCSS*SRSGP 

J 

AGTSATGAPANRFLPLVR 
LERPHRVLQPMGFCPFFE 
SSGHIGYWSPCESVPS SS 

GCT CGA GGG CAC CTA CGG CAT GGT CGA CCC CGT AAG GCT TTG TCC CCT TCT TGA 
6327 6336 6345 6354 6363 6372 

CGA GCT CCC GTG GAT GCC GTA CCA GCT GGG GCA TTC CGA AAC AGG GGA AGA ACT 

RAPVDAVPAGAFRNRGRT 
ELPWMPYQLGHSETGEEL 
SSRGCRTSWGIPKQGKNS 

GRRALPGDVQAAPRPRQA 
AGDPLPGTLKPQLVLDSL 
PGTPCPAR*SPSCSSTAS 

GCC GGG GCA GCC CGT TCC CCG GGC AGT TGA ACC CGA CGT CCT GCT CCA GCG ACT 
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638-1 6390" 6399^ 6408" SAM 6426 

CGG CCC CGT CGG GCA AGG GGC CCG TCA ACT TGG GCT GCA GGA CGA GGT CGC TGA 



RPRRARGPSTWAAGRGR * 
GPVGQGARQLGLQDEVAE 
APSGKGPVNLGCRTRSL S 

RLLATALERDLPHRRLQR 
ASYLRRWNEISHTGVSSD 
RPTSGDGIRSRTPASPAT 



CGC GCC TCA TCT CGG CAG CGG TTA AGA GCT AGC TCA CCC ACG GCT GCC TCG ACA 
6435 6444 6453 6462 6471 6480 

GCG CGG AGT AGA GCC GTC GCC AAT TCT CGA TCG AGT GGG TGC CGA CGG AGC TGT 



ARSRAVANSRSSGCRRSC 
RGVEPSP ILDRVGAD GAV 
AE*SRRQFSIEWVPTELS 

RRHRCRGLPR*FD I I -LRR 
DATAVGGLHGDS I S * * A G 
TPPPSVAWTATLFRNDPA 



GCA GCC GCC ACC GCT GTG GCG GGT TCA CCG GCA GTC TTT AGC TAA TAG TCC GCG 
6489 6498 6507 6516 6525 6534 

CGT CGG CGG TGG CGA CAC CGC CCA AGT GGC CGT CAG AAA TCG ATT ATC AGG CGC 



RRRWRHRPSGRQKS I IRR 
VGGGDTAQVAVRNRL S GA 
S A ATPPKWPSE IDYQAP 

r> 

DRPFSCALEIQEDSLYQR 
TGPFR APWNSRSTRC I S G 
PGQSVLLGTRDARGVSVA 



GCC AGG GAC CCT TTG CTC GTC CGG TCA AGC TAG ACG AGC AGG CTG TCT ATG ACG 
6543 6552 6561 6570 6579 6588 

CGG TCC CTG GGA AAC GAG CAG GCC AGT TCG ATC TGC TCG TCC GAC AGA TAC TGC 



RSLGNEQASSICS SDRYC 
GPWETSRPVRSARPTDTA 
VPGKRAGQFDLLVRQ I LP 

AEFMFVLHTGWRVDP EVP 
PRSCSCL IHEGACTRSWR 
PGRVHVC STNGLARGAGG 



GCC CGG AGC TTG TAC TTG TGT TCT ACA CAA GGG GTC GCG TGC AGG CCG AGG TGG 
6597 6606 6615 6624 6633 6642 

CGG GCC TCG AAC ATG AAC ACA AGA TGT GTT CCC CAG CGC ACG TCC GGC TCC ACC 



RASNMNTRCVPQRTSGST 
GPRT*TQDVFPSARPAPP 
GLEHEHKMCSP AHVRLHR 

L H _R PIQEDMRSLAGSVRV 
FIGRSRSTWGRFRAASGS 
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S S A A P D A R G D A F A R R Q G P 



CCT TCT ACG GCG CCC TAG ACG AGC AGG TAG GCG CTT TCG CGC GGC GAC TGG GCC 
6651 6660 6669 6678 6687 6696 

GGA AGA TGC CGC GGG ATC TGC TCG TCC ATC CGC GAA AGC GCG CCG CTG ACC CGG 



GRCRGICSS IRESAP LTR 
EDAAGSARPSAKARR * PG 
KMPRDLLVHPRKRAADPD 

ECGAEGAAEVYAAVTQSF 
RVARKVRRRWMPPL PRAS 
G*LGS *GGGGCLRCRDPQ 



TGG AGT GTC GGG CGA AGT GGG CGG CGG AGG TGT ATC CGC CGT TGC CAG ACC GAC 
6705 6714 6723 6732 6741 6750 

ACC TCA CAG CCC GCT TCA CCC GCC GCC TCC ACA TAG GCG GCA ACG GTC TGG CTG 



TSQPA SPAAST*AATVWL 
PHSPLHPPPPHRRQRSG* 
LTARFTRRLHI GGNGLAE 

GAQWHLNGAVLVRAEAMG 
DRRGI FIGP*SCGPKRWE 
IGGAL SSERSRAGPSGGN 



TTA GGG CGG ACG GTT ACT TCT AAG GGC CGA TGC TCG TGG GCC CGA AGG CGG TAA 
6759 6768 6777 6786 6795 6804 

AAT CCC GCC TGC CAA TGA AGA TTC CCG GCT ACG AGC ACC CGG GCT TCC GCC ATT 



NPACQ *RFPATSTRA SAI 
IPPANEDSRL RAPGLPPF 
SRLPMKIPGYE HPGFRHS 

GEWPCVQLWWQRQSDLSF 
ARGLVCRYGGSASHT * P F 
RGGLSVGTAVVPATLRPF 



GGC GGG AGG GTT CCT GTG TGG ACA TCG GTG GTG ACC GCG ACA CTC AGA TCC CTT 
6813 6822 6831 6840 6849 6858 

CCG CCC TCC CAA GGA CAC ACC TGT AGC CAC CAC TGG CGC TGT GAG TCT AGG GAA 



PPSQGHTCSHHWRCE SRE 
R PPKDTPVATTGAVS LGK 
A LPRTHL*PPLAL*V*GK 

SSPFCQHFCQLFCQPCFE 
PVPSVSTFVSSFVSPVFN 
LFQPFVPSFVPSFVPSL I 



TTC CTT GAC CCC TTT GTG ACC ACT TTT GTG ACC TCT TTT GTG ACC CCT GTT TTA 
6867 6876 6885 6894 6903 6912 

AAG GAA CTG GGG AAA CAC TGG TGA AAA CAC TGG AGA AAA CAC TGG GGA CAA AAT 



KELGKHW*KHWRKHWGQN 
RN.WGNTGENTGENTGDKI 
GTGETLVKTLEKTLGTKF 
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APVAA*PGAELVDAARVL 
LRSRQEPAQRWCTPQGSW 
* G P G S SLPRGGARRS GPG 

AGT CGG CCC TGG CGA CGA GTC CCC GGA CGG AGG TCG TGC AGC CGA CGG GCC TGG 
6921 6930 6939 6948 6957 6966 

TCA GCC GGG ACC GCT GCT CAG GGG CCT GCC TCC AGC ACG TCG GCT GCC CGG ACC 

SAGTAAQGPASSTSAART 
QPGPLLRGLPPARRL PGP 
SRDRCSGACLQHVGCPDQ 

VASRTGIKLRELAKVPAV 
YPRAPASR*GSWPR* PLW 

TRGLPHRDEAAGPGKRSG 

TCA TGC CGG CTC GCC CAC GGC TAG AAG TCG GCG AGG TCC CGG AAA TGC CCT CGG 
6975 6984 6993 7002 7011 7020 

AGT ACG GCC GAG CGG GTG CCG ATC TTC AGC CGC TCC AGG GCC TTT ACG GGA GCC 

STAERVPIFSRSRAFTGA 
VRPSGCRSSAAPGPLREP 
YGRAGADLQPLQGLYGSH 

PIKRSRDTVAIVAHAPLA 
RSRVAATPSPS*RMRPCR 
GPD*P QPRHRRDGCA RAA 

TGG CCC TAG AAT GCC GAC GCC AGC CAC TGC CGC TAG TGG CGT ACG CGC CCG TCG 
7029 7038 7047 7056 7065 7074 

ACC GGG ATC TTA CGG CTG CGG TCG GTG ACG GCG ATC ACC GCA TGC GCG GGC AGC 

TGILRLRSVTAITACAGS 
PGSYGCGR*RRSPHARAA 
RDLTAAVGDGDHRMRGQR 

SALSRLLARWRSRPCRGK 
RRSRACCPGGGAARAGAR 
GVRALAAPGAVPQAPVQG 

CGG CTG CGC TCG CTC GCG TCG TCC CGG GCG GTG GCC GAC GCG CCC GTG GAC GGG 
7083 7092 7101 7110 71 19 7128 

GCC GAC GCG AGC GAG CGC AGC AGG GCC CGC CAC CGG CTG CGC GGG CAC CTG CCC 

ADASERSRARHRLRGHLP 
PTRASAAGPATGCAGTCP 
RRERAQQGPPPAARAPAL 

GTRASGYPLDALVVDPAS 
GLAHAGTRCTPWCSMPRP 
EWHTR ERVAPRGARCRAR 

AAG GGT CAC GCA CGC GAG GGC ATG CCG TCC AGC CGG TCG TGC TGT AGC CCG CGC 
7137 7146 71 55 7164 7173 7182 

TTC CCA GTG CGT GCG CTC CCG TAC GGC AGG TCG GCC AGC ACG ACA TCG GGC GCG 
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F P V R A L P Y G R S A S T T S G A 
SQCVRSRTAGRPARHRAR 
PSACAPVRQVGQHDI GRG 

GALVAS LARPDFVDAT R I 
GPSSPPCRVRISSTRPAS 
VRRPRRVACASRLRGRHP 

CTG GGC CGC TCC TGC CGC CTG TCG CGT GCG CCT AGC TTC TGC AGG CGC CAC GCC 
7191 7200 7209 7218 7227 7236 

GAC CCG GCG AGG ACG GCG GAC AGC GCA CGC GGA TCG AAG ACG TCC GCG GTG CGG 

DPARTAD SARGSKTSAVR 
TRRGRRTAHADRRRPR CG 

PGED.GGQRTRIEDVRGAD 

ACPLAGGEATLRERLRRA 
PARCRVARRR*AS GCGAP 
HRVAACRGGGDPAGAAP P 

TAC CGC GTG CCG TCG CGT GGC GGG AGG CGG CAG TCC GCG AGG GCG TCG GCC GCC 
7245 7254 7263 7272 7281 7290 

ATG GCG CAC GGC AGC GCA CCG CCC TCC GCC GTC AGG CGC TCC CGC AGC CGG CGG 

MAHGSA PPSAVRRSRSRR 
WRTAAHRPPPSGAPAAGG 
GARQRTALRRQALPQp AG 

A QAAELYSPKGFRESQER 
PRRPRW I PPSASV SAR S V 
RGARGGS LLAQRFAREA * 

CGC CGG ACG CGC CGG AGG TCT ATC CTC CCG AAC GGC TTT GCG AGC GAG ACG AGT 
7299 7308 7317 7326 7335 7344 

GCG GCC TGC GCG GCC TCC AGA TAG GAG GGC TTG CCG AAA CGC TCG CTC TGC TCA 

AACAASR*EGLPKRSLCS 
RPARPPDRRACR NARSAH 
GLRGLQ IGGLA ETLAL L T 

RELERATLGAPSLLALNK 
GNSSARP*GPRRSCPSIR 
ATRARARDARGALAPRS E 

GCG GCA AGC TCG AGC GCG CGC CAG TCG GGC CGG CCG CTC TCG TCC CGC TCT AAG 
7353 7362 7371 7380 7389 7398 

CGC CGT TCG AGC TCG CGC GCG GTC AGC CCG GCC GGC GAG AGC AGG GCG AGA TTC 

RRSSSRAVSPAGESRARF 
AVRARAR SARPARAGRD S 
PFELARGQPGRREQGE I L 

AALELPAPDVDSAIVQRL 
RRSSWRPPTWMPPS*RGC 
EGRAGAPRPGCRLRDGAA 



AAG CGG CGC TCG AGG TCG CCC CGC CCC AGG TGT AGC CTC CGC TAG TGG ACG GCG 
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7407 7416 7425 = 7434 7443 74 52 

TTC GCC GCG AGC TCC AGC GGG GCG GGG TCC ACA TCG GAG GCG ATC ACC TGC CGC 

FAASSSGAGSTSEAITCR 
SPRAPAGRGPHRRRSPAA 
RRELQRGGVHIGGDHLPQ 

SRRHLLGLVTLLYGSG CC 
RAGTCCGWCR*STVAAAA 
ALAPAAAGAGDPPLRQRL 

TCG CTC GCG GCC ACG TCG TCG GGG TCG TGG CAG TCC TCC ATT GGC GAC GGC GTC 
7461 7470 7479 7488 7497 7506 

AGC GAG CGC CGG TGC AGC AGC CCC AGC ACC GTC AGG AGG TAA CCG CTG CCG CAG 

SERRCSSPSTVRR*p L PQ 
ASAGAAAPAPSGGNRCRS 
RAPVQQPQHRQEVTAAAA 

PDWLTVPGDGPLRALARQ 

RTGCR*RVTAPSAPSPGS 
VPGVADGSRRRPppRp GA 

GTG CCC AGG GTG TCG CAG TGG CCT GGC AGC GGC CCC TCC GCC CGC TCC CGG GCG 
7515 7524 7533 7542 7551 7560 

CAC GGG TCC CAC AGC GTC ACC GGA CCG TCG CCG GGG AGG CGG GCG AGG GCC CGC 

HGSHSVTGPSPGRRARAR 
TGPTASPDRRRGGGRGPA 
RVPQRHRTVAGEAGEGPL 

FIETALR .VPFAPYGPASH 
S SRPRWASPSPPTVRRPT 
PLDRDGPPRPLRPLGARL 

ACC TTC TAG AGC CAG CGG TCC GCC TGC CCC TTC CGC CCC ATT GGG CCG CGC CTC 
7569 7578 7587 7596 7605 7614 

TGG AAG ATC TCG GTC GCC AGG CGG ACG GGG AAG GCG GGG TAA CCC GGC GCG GAG 

WKISVARRTGKAG*PGAE 
GRSRSP GGRGRRGNPAR S 
EDLGRQADGEGGVTRRGV 

LVVGCALDSSDIREVAHR 
SCSVAP S IPVTSGSWP TA 
PARCRLR SRFQRDAGR RP 

ACC TCG TGC TGT GGC GTC CGC TCT AGC CTT GAC AGC TAG GCG AGG TGC CGC ACC 
7623 7632 7641 7650 7659 7668 

TGG AGC ACG ACA CCG CAG GCG AGA TCG GAA CTG TCG ATC CGC TCC ACG GCG TGG 

WSTTPQARSELSIRSTAW 
GARHRRRDRNCRSAPRRG 
EHDTAGEIGTVDPLHGVA 

Y A *wS (v) QGSGLVESGGGDCG 
T R V "* RDVGWYKPVAE T AA 
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GCC ATG CGT GAG TGG ACA GGT GAG GGG TCA TGA AGC CTT GGC GGA GGC AGC GTC 
7677 7686 7695 7704 7713 7722 

CGG TAC GCA CTC ACC TGT CCA CTC CCC AGT ACT TCG GAA CCG CCT CCG TCG CAG 

RYALTCPLPSTSEPPPSQ 
GTHSPVHSPVLRNRLRrs 
VRTHLSTPQYFGTASVA 

QLS*LAAAGAPSAGLQRR 

RFRDYHRPGPRPLEWSGG 
GSAIMTGRGRGPFSGAAA 

GGG ACT TCG CTA GTA TCA CGG CGC CGG GGC CGG CCC CTT CGA GGG TCG ACG GCG 
7731 7740 7749 7758 7767 7776 

CCC TGA AGC GAT CAT AGT GCC GCG GCC CCG GCC GGG GAA GCT CCC AGC TGC CGC 

P * SDHSAAAPAGEAP S CR 
P EA I I V P RPRP GK L P A A A 
LKRS*CRGPGRGSSQLPP 

VCLDGAGGPSDTTGP SAP 
SVCTVPAEPA TPRGLHLR 
P C VP * R R R RPQRD DW T F G 

GCC TGT GTG TCC AGT GGC CGC GGA GGC CCC GAC AGC CAG CAG GGT CCA CTT CGG 
7785 7794 7803 7812 7821 7830 

CGG ACA CAC AGG TCA CCG GCG CCT CCG GGG CTG TCG GTC GTC CCA GGT GAA GCC 

RTHRSPAPPGLSVVP GEA 
GHTGHRRLRGCRSSQVKP 
DTQVTGASGAVGRPR * SR 

RDARDGGLDRLNERIHGS 
ATPATVAWIESTKGFTGR 
PPRRP*RGFRQPKGSHAG 

CCC GCC AGC CGC GCC AGT GGC GGG TTT AGA GAC TCC AAA AGG GCT TAC ACG GGG 
7839 7848 7857 7866 7875 7884 

GGG CGG TCG GCG CGG TCA CCG CCC AAA TCT CTG AGG TTT TCC CGA ATG TGC CCC 

GRSARSPPKSLRFSRMCP 
GGRRGHRPNL*GFPE CAP 
AVGAVTAQISEVFPNVPR 

RRNGCE SATTALFPPGHG 
GVIAASRHRLQSSPRAMD 
V* SQRVGIGYNRPLAPWT 

CTG GAT GCT AAC GGC GTG AGG CTA CGG CAT CAA CGC TCC TTC CCG CCC GGT ACA 
7893 7902 7911 7920 7929 7938 

GAC CTA CGA TTG CCG CAC TCC GAT GCC GTA GTT GCG AGG AAG GGC GGG CCA TGT 

DLRLPHSDAVVARKGGPC 
TY,DCRTPMP*LRGRAGHV 
PTIAALRCRSCEEGRA (m) S 
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HE RPE*GSCTQQHGSPRj 
MNGPNEAPVRRSTVPPAP 
WTGPTRLRFVDAPSRLPP 

GGT ACA AGG GCC CCA AGA GTC GGC CTT GTG CAG ACG ACC ACT GGC CTC CCC GCC 
7947 7956 7965 7974 7983 7992 

CCA TGT TCC CGG GGT TCT CAG CCG GAA CAC GTC TGC TGG TGA CCG GAG GGG CGG 

PCSRGSQPEHVCW*PEGR 
HVPGVL SRNTSAGDRR GG 

MFPGFSAGTRLLVTGGAC 

EDARVHDVGEQLGPGL D( 
KMPECTTSAKRSAPAS TV 
S*RSARPRRRGPPRpRp * 

CGA AGT AGC CGA GCG TGC ACC AGC TGC GGA AGG ACC TCC GGC CCC GGC TCC AGT 
8001 8010 8019 8028 8037 8046 

GCT TCA TCG GCT CGC ACG TGG TCG ACG CCT TCC TGG AGG CCG GGG CCG AGG TCA 

ASSARTWSTPSWRPGPRS 
LH'RLARGRRLPGGRGRGH 
FIGSHVVDAFLEAGAEV 1 : 

HQVVQGGTVRFTQVWTRI 
TSSSRVVPSGSRRSGRAT 
RAPRGSWRHGPVDPGVHP 

GGC ACG ACC TGC TGG ACT GGT GGC CAC TGG GCC TTG CAG ACC TGG GTG CAC GCC 
8055 8064 8073 8082 8091 8100 

CCG TGC TGG ACG ACC TGA CCA CCG GTG ACC CGG AAC GTC TGG ACC CAC GTG CGG 

PCWTT*PPVTRNVWTHVR 
RAGRPDHR*PGTSGPTCG 
VLDDLTTGDPERLDPRA^ 

DTADVHGIGGGQVLGHPI 
MRRTSTVSAAARS SATRD 
* G D R R R SRHRRGPRPRAT 

AGT AGG CAG CGC AGC TGC ACT GGC TAC GGC GGC GGG ACC TGC TCC GGC ACG CCA 
8109 81 18 8127 8136 8145 8154 

TCA TCC GTC GCG TCG ACG TGA CCG ATG CCG CCG CCC TGG ACG AGG CCG TGC GGT 

SSVAST*PMPPPWTRPCG 
HPSRRRDRCRRPGRGRAV 
IRRVDVTDAAALDEAVR £ 

RAGVDDAMERGLDVDP D I 
ARGSTMQWRAAWISTRTE 
PAGRR* RGDRPGSRRGPR 

GCC GCG CGG GGC TGC AGT AGA CGG TAG AGC GCC GGG TCT AGC TGC AGG CCC AGA 
8163 8172 8181 8190 8199 8208 

CGG CGC GCC CCG ACG TCA TCT GCC ATC TCG CGG CCC AGA TCG ACG TCC GGG TCT 
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R R A P T S S A* r S R P R S T S G S 
GAPRRHLPSRGPDRRPGL 
ARPDVICHLAAQIDVRVS 

HGCRGDVRPDVDLARDVH 
TAVGATSARTLTSPVI L T 
PPWVPRRRAP * R R P C S * R 

GCC ACC GGT GTG GCC GGC AGC TGC GCG CCC AGT TGC AGC TCC CGT GCT AGT TGC 
8217 8226 8235 8244 8253 8262 

CGG TGG CCA CAC CGG CCG TCG ACG CGC GGG TCA ACG TCG AGG GCA CGA TCA ACG 

RWPHRPSTRGSTSRARST 
GGHTGRRRAGQRRGHDQR 
VAT PAVDARVNVE GT I NV 

QFRRVGDPRPDHEGGG AP 
SSAACATPARTTNAEVPP 
APLPARRRPAPRTRRWRR 

ACG ACC TTC GCC GCG TGC GGC AGC CCC GCG CCC AGC ACA AGC GGA GGT GGC CGC 
8271 8280 8289 8298 8307 8316 

TGC TGG AAG CGG CGC ACG CCG TCG GGG CGC GGG TCG TGT TCG CCT CCA CCG GCG 

CWKRRTPSGRGSCSPPPA 
AGS GARRRGAGRVRL HRR 
LEAAHAVGARVVFAS T GG 

REVP FANRDRRVLVRQ GP 
AS*PSPTGTGVFSSVSGL 
PARRP LREPGSSRPCAAW 

CCC GCG AGA TGC CCC TTC CGC AAG GCC AGG GCT GCT TGC TCC TGT GCG ACG GGT 
8325 8334 8343 8352 8361 8370 

GGG CGC TCT ACG GGG AAG GCG TTC CGG TCC CGA CGA ACG AGG ACA CGC TGC CCA 

GRSTGKAFRSRRTRTRCP 
GALRGRRSGPDERGHAAQ 
ALYGEGVPVPTNEDTLPR 

RPRGVARGLVARLLVDAQ 
GPAG* PVALYQAS FYMPR 

APPARRCPWTSRPSTCRG 

CCG GCC CCC GCG GGA TGC CGT GCC GGT TCA TGA CGC GCC TCT TCA TGT AGC CGG 
8379 8388 8397 8406 841 5 8424 

GGC CGG GGG CGC CCT ACG GCA CGG CCA AGT ACT GCG CGG AGA AGT ACA TCG GCC 

GRGRP TARPSTARRS T SA 
AGGALRHGQVLRGEVHRP 
PGAPYGTAKYCAEKY I GL 

EVPQVSGLVAHQPEAVHV 
NLRSCPVSCL TNRSPLTY 
T*GAARFRACRTAARCRT 



ACA AGT TGG CCG ACG TGC CTT GGC TCG TGT CGC ACA ACG CCG AGC CGT TGC ACA 
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8433 8442 845T 8460 8*469 ' 8478 

TGT TCA ACC GGC TGC ACG GAA CCG AGC ACA GCG TGT TGC GGC TCG GCA ACG TGT 



CSTGCTEPSTACCGSATC 
VQPAARNRAQRVAARQRV 
FNRLHGTEHSVLRLGNVY 

PGPLARATLRADDGDVAP 
PGRCLGPPSAPTMAM*QP 
RAGAS GPRHPPR*RWRSR 



TGC CCG GGG CCG TCT CGG GCC CGC CAC TCC GCC CGC AGT AGC GGT AGA TGA CGC 
8487 8496 8505 8514 8523 8532 

ACG GGC CCC GGC AGA GCC CGG GCG GTG AGG CGG GCG TCA TCG CCA TCT ACT GCG 



TGPGRARAVRRASSPSTA 
RAPAEPGR*GGRHRHL LR 
GPRQSPGGEAGVIAIYCG 

QGGLASHGRHEAVTRLGT 
SAESPPTGVTNPSPECVR 
APRRPRLAWPTRRRNAS G 



CCG ACC GGA GGC TCC CGC CTC ACG GGT GCC ACA AGC CGC TGC CAA GCG TCT GGG 
8541 8550 8559 8568 8577 8586 

GGC TGG CCT CCG AGG GCG GAG TGC CCA CGG TGT TCG GCG ACG GTT CGC AGA CCC 



GWPPRAECPRCSATVRRP 
AGLRGRSAHGVRRRFADP 
LAS E GGVPTVFGDG S Q T R 

VVHVDAVDGR -REDRRVAG 
S * T Y T P S T AAA N'T A G Y P V 

HSRTRRRRRRPTRRATRC 



CAC TGA TGC ACA TGC AGC CGC TGC AGC GGC GCC GCA AGC AGC GCG GCA TGC CGT 
8595 8604 8613 8622 8631 8640 

GTG ACT ACG TGT ACG TCG GCG ACG TCG CCG CGG CGT TCG TCG CGC CGT ACG GCA 



VTTCT SATSPRRS SRRTA 
*LRVRRRRRRGVRRAVRH 
DYVYVGDVAAAFVAPYGT 

DARRR SCRVRALPARHQ L 
TPGADPVDSVPLPLVTS S 
RRGPTQFMPCPCPSCPAP 



GGC AGC CGG GCC GCA GAC CTT GTA GCC TGT GCC CGT TCC CCT CGT GCC ACG ACC 
8649 8658 8667 8676 8685 8694 

CCG TCG GCC CGG CGT CTG GAA CAT CGG ACA CGG GCA AGG GGA GCA CGG TGC TGG 



PSARRLEHRTRARGARCW 
RRPGVWNIGHGQGEHGAG 
VGPA S GT SDTGKGS TVL E 

D E — V VDGGGGPAVQRGTER 
TRSWMAAAEPRSRGGRKA 
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TCC AGG AGC TGG TGT AGC GGC GGC GGA GGC CCG CGC TGG ACG GAG GGG CAA AGC 
8703 8712 8721 8730 8739 8748 

AGG TCC TCG ACC ACA TCG CCG CCG CCT CCG GGC GCG ACC TGC CTC CCC GTT TCG 



RSST TSPPPPGATCLPV S 
GPRPHRRRLRARPASPFR 
VLDHIAAASGRDLPPRFi 

GAPRALDLVAGQVDSTD( 
GRRGP S I WCLVRS TVRTA 
AGGAPRSGACCGPR*EHR 

GCG GGG CGG CCG GCC CGC TCT AGG TCG TGT CGT GGG ACC TGC AGT GAG CAC AGC 
8757 8766 8775 8784 8793 8802 

CGC CCC GCC GGC CGG GCG AGA TCC AGC ACA GCA CCC TGG ACG TCA CTC GTG TCG 

RPAGRAR SSTAPWTS LV S 
APPAGRDPAQHPGRHSCR 
PRRPGE I QHSTLDVTRV i 

GIQAPGRGDRQLFADGGC 
ASRPQVADTGSSFPMAA V 
RRDPS SRTRGAPSLCRRW 

GGC GGC TAG ACC CGA CCT GGC GCA GGC AGG GCG ACC TCT TTC CGT AGC GGC GGT 
8811 8820 8829 8838 8847 8856 

CCG CCG ATC TGG GCT GGA CCG CGT CCG TCC CGC TGG AGA AAG GCA TCG CCG CCA 

PPIWAGPRPSRWRKASPP 
RRSGLDRVRPAGERHRRH 
ADLGWTASVPLEKGI A A 1 

VGPDTGTRGDPLLC S * Si 
*AQTREPEGTRCCAHSVQ 
RRRPGNRNARGAAPMVL K 

GGA TGC GGA CCC AGG CAA GGC CAA GCG GGC AGG CCG TCG TCC GTA CTG ATT GAA 
8865 8874 8883 8892 8901 8910 

CCT ACG CCT GGG TCC GTT CCG GTT CGC CCG TCC GGC AGC AGG CAT GAC TAA CTT 

PTPGSVPVRPSGSRHD'* L 
LRLGPFRFARPAAGMTNL 
YAWVRSGSPVRQQA*LTC 

CACCSDTASASRPPPGTC 
APAAPTRPRRRDRHRGRV 
RLRLLLGHGVGIATAAGY 

CGC GTC CGC GTC GTC CTC AGG CAC CGG CTG CGG CTA GCG CCA CCG CCG GGG CAT 
8919 8928 8937 8946 8955 8964 

GCG CAG GCG CAG CAG GAG TCC GTG GCC GAC GCC GAT CGC GGT GGC GGC CCC GTA 

AQAQQE SVADADRGGGPV 
RR RSRSPWPTPIAVAAPY 
AGAAGVRGRRRSRWRPRl 
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ASCCHHAARSRRPATGP * 
RLVATTHLAVGARHPAPD 
VCFLLPTCRSEPATRHRT 

GTG CGT CTT GTC GTC ACC ACA CGT CGC GCT GAG GCC GCG CCA CGC CAC GGC CCA 
8973 8982 8991 9000 9009 9018 

CAC GCA GAA CAG CAG TGG TGT GCA GCG CGA CTC CGG CGC GGT GCG GTG CCG GGT 

HAEQQW CAARLRRGAVP G 
TQNS SGVQRDSGAVRCRV 
RRTAVVC SATPARCGAGS 

SRASDRRRSTGDRRRVCG 
AGQPTGGGVPATAGGFAG 
LEKRLGAASQHRRAESRV 

GTC GAG GAA CGC CTC AGG GCG GCG GCT GAC CAC GGC AGC GCG GAG GCT TGC GTG 
9027 9036 9045 9054 9063 9072 

CAG CTC CTT GCG GAG TCC CGC CGC CGA CTG GTG CCG TCG CGC CTC CGA ACG CAC 

QLLAESRRRLVPSRLRTH 
SSLRSPAADWCRRASERT 
APCGVPPPTGAVAPPNAP 

ALLGPAPPLPPHAPRPRC 
QWYARRLLYRLTLRGPDV 
RGTPGACSTASPSGAPTS 

GGA CGG TCA TCC GGG CCG CGT CCT CCA TCG CCT CCC ACT CGG CCG GCC CCA GCT 
9081 9090 9099 9108 9117 9126 

CCT GCC AGT AGG CCC GGC GCA GGA GGT AGC GGA GGG TGA GCC GGC CGG GGT CGA 

PASRPGAGGSGG*AGRGR 
LPVGPAQEVAEGEPAGVD 
CQ*ARRRR*RRVSRPGST 

RPRGRARAAPLERAGAEK 
DHVVAHEPLLCSARVRRR 
MT SSRT SPCCAARACGGG 

GTA GCA CCT GCT GGC GCA CGA GCC CGT CGT CCG TCG AGC GCG CGT GGG CGG AGG 
9135 9144 9153 9162 9171 9180 

CAT CGT GGA CGA CCG CGT GCT CGG GCA GCA GGC AGC TCG CGC GCA CCC GCC TCC 

HRGRPRARAAGSSRAPAS 
IVDDRVL GQQAARAH .P PP 
SWTTACSGSRQLARTRLL 

ML AI FSTDEGSQLNVGTR 
**RSSPPTRVPS CTSAPA 
EDARHLLHG*RVAPQRRH 

AAG TAG TCG CGC TAC TTC CTC CAC AGG AGT GGC CTG ACG TCC AAC TGC GGC CAC 
9189 9198 9207 9216 9225 9234 

TTC ATC AGG GCG ATG AAG GAG GTG TCC TCA CCG GAC TGC AGG TTG ACG CCG GTG 
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F ISA M K~ E \T S S P D C R L* " T P V 
SSAR*RRCPHRTAG*rr C 
HQRDEGGVLTGLQVDAGA 

SLDLDFTLGQRRAFDADV 
A*TWTSPSARAARSTPTS 
PEPGPRLHPGPPARLRRR 

GCC GAG TCC AGG TCC AGC TTC CAC TCC GGG ACC GCC GCG CGC TTC AGC CGC AGC 
9243 9252 9261 9270 9279 9288 

CGG CTC AGG TCC AGG TCG AAG GTG AGG CCC TGG CGG CGC GCG AAG TCG GCG TCG 

RLRSRSKVRPWRRAKSAS 
GSGPGRR*GPGGARSRRR 
AQVQVEGEALAAREVGVD 

GMCAGWI KIDGRDRHWGV 
AWAPAGSRSTGATATGAS 
RGHLRGLDQHGRPRPALR 

TGC GGG TAC GTC CGC GGG GTC TAG AAC TAC AGG GGC GCC AGC GCC ACG GTC GGC 
9297 9306 9315 9324 9333 9342 

ACG CCC ATG CAG GCG CCC CAG ATC TTG ATG TCC CCG CGG TCG CGG TGC CAG CCG 

TPMQAPQILMSPRSRCQP 
RPCRRPRS*CPRGRGASR 
AHAGAPDLDVPAVAVPAD 

LHFQGSSLFWPLRRLERP 
STSSGRPCSGPCGA SSER 
RPPVAGLVPVLAAPPARA 

TGC TCC ACC TTG ACG GGG CTC CTG TCC TTG GTC CCG TCG GCC GCC TCG AGA GCG 
9351 9360 9369 9378 9387 9396 

ACG AGG TGG AAC TGC CCC GAG GAC AGG AAC CAG GGC AGC CGG CGG AGC TCT CGC 

TRWNCPEDRNQGSRRSSR 
RGGTAPRTGTRAAGGALA 
EVELPRGQEPGQPAELSR 

PRLRAGVVHAGARFAARV 
RDCGRVSWTRGPASRPAS 
ATAAACRGRAGRRPVRRP 

CCG CCA GCG TCG GCG CGT GGC TGG TGC ACG CGG GGC CGC GCC TTG CGC CGC GCC 
9405 9414 9423 9432 9441 9450 

GGC GGT CGC AGC CGC GCA CCG ACC ACG TGC GCC CCG GCG CGG AAC GCG GCG CGG 

GGRS RAPTTCAPARNAAR 
AVAAA HRPRAPRRGTRRG 
RSQPRTDHVRPGAERGAD 

ADVASAELRVDDDVFLVH 
PTWPPPRWGCTTTWSCCT 
RRGRRLGGAARRRGRVAR 



TGC CGC AGG TGC CGC CTC CGG AGG TCG GCG TGC AGC AGC AGG TGC TTG TCG TGC 
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9459 9468 9477 9486 9495 9504 

ACG GCG TCC ACG GCG GAG GCC TCC AGC CGC ACG TCG TCG TCC ACG AAC AGC ACG 



TASTAEAS SRTS S S T N S T 
RRPRRRPPAARRRPRTAR 
GVHGGGLQPHVVVHEQHV 

RDAWERLVTNRSAS LGRT 
GTPGNGCCRTVPRRC GER 
APRGMGAAGH*PVGVARA 

ACG GCC AGC CGG GTA AGG GCG TCG TGG CAC AAT GCC CTG CGG CTG TCG GGA GCG 
9513 9522 9531 9540 9549 9558 

TGC CGG TCG GCC CAT TCC CGC AGC ACC GTG TTA CGG GAC GCC GAC AGC CCT CGC 

CRSAHSRSTVLRDAD SPR 
AGRP I PAAPCYGTPTA LA 
PVGPFPQHRVTGRRQ P SR 

AGLIRMTGGAENVQTAVK 
PGWSGCRGGPRT*RPPSR 
HGGPDADDGRGREGPHRG 

CAC CGG GGG TCC TAG GCG TAG CAG GGG GGC CGG AGC AAG TGG ACC CAC CGC TGG 
9567 9576 9585 9594 9603 9612 

GTG GCC CCC AGG ATC CGC ATC GTC CCC CCG GCC TCG TTC ACC TGG GTG GCG ACC 

VAPRIRIVPPASFTWVAT 
WPPGSASSPRPRSPGWRP 
GPQDPHRPPGLVHL GGDL 

EAEPT VPRDLLVVYED GN 
RPRLH*RGTWCCSTNTVT 
ERG*TDGAPGAARRIR*r 

AAG AGC CGG AGT CCA CAG TGG CCG GCC AGG TCG TCG TGC TGC ATA AGC AGT GGC 
9621 9630 9639 9648 9657 9666 

TTC TCG GCC TCA GGT GTC ACC GGC CGG TCC AGC AGC ACG ACG TAT TCG TCA CCG 

FSAS GVTGRSSSTTYSSP 
SRPQV SPAGPAARR I RHR 

LGLRCHRPVQQHDVFVTV 

LQDLNHRLHRRVNELRFA 
*STSTTGCIGASTRWVSP 
EVPRPQAASAPPREGSPL 

AAG TTG ACC AGC TCC AAC ACG GCG TCT ACG GCC GCC TGC AAG AGG TCT GCC TTC 
9675 9684 9693 9702 9711 9720 

TTC AAC TGG TCG AGG TTG TGC CGC AGA TGC CGG CGG ACG TTC TCC AGA CGG AAG 

FN WSRLCRRCRRTFSRRK 
STGRGCAADAGGRSPDGR 
QLVEVVPQMPADVLQTEG 

C V ,uA V V (m) PRRGPTNRDATE 
VSRWWWQVGGPPTGTRLR^ 
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CGT GTC TGG CGG TGG TGG TAA CCT GCG GCG GGC CCC CAC AAG GCC AGG CGT CAG 
9729 9738 9747 9756 9765 9774 

GCA CAG ACC GCC ACC ACC ATT GGA CGC CGC CCG GGG GTG TTC CGG TCC GCA GTC 

AQTATT I GRRPGVFR SAV 
HRPPPPLDAARGCSGPQS 
TDRHHHWTPPGGVP VR S L 

KKDVTVGTHSREAPPPVR 
KRTWL*ELIAANRRRPCE 
REQGCD SWYPQTGGAP A S 

AGA AAG AAC AGG TGT CAG TGA GGT CAT ACC GAC GCA AGG CGG CCG CCC CCG TGA 
9783 9792 9801 9810 9819 9828 

•TCT TTC TTG TCC ACA GTC ACT CCA GTA TGG CTG CGT TCC GCC GGC GGG GGC ACT 

SFLSTVTPVWLRSAGGGT 
LSCPQSLQYGCVPPAGAL 
FLVHSHSSMAAF RRRGHS 

SH*DDNMTRVAK*SIH*L 
RT. DTTM *RVFQKRL F T S F 

ALTLR*EDYSSSELFHAL 

GCG CTC ACA GTC AGC AGT AAG TAG CAT GCT TGA CGA AAG ATT CTT TAC ACG ATT 
9837 9846 9855 9864 9873 9882 

CGC GAG TGT CAG TCG TCA TTC ATC GTA CGA ACT GCT TTC TAA GAA ATG TGC TAA 

RECQSSFIVRTAF*EMC* 
ASVSRHSSYELLSKKCAK 

RVSVV I hrtncflrnvlk 

IPPESRMPATLRSADA* W 
FRRSRGCQRQ*DRLTPRG 
SDAAGVANASNTEFRRGV 

TCT TAG CCG CCG AGG CTG GCG TAA CCG CGA CAA TCA GAG CTT CGC AGC CGG ATG 
9891 9900 9909 9918 9927 9936 

AGA ATC GGC GGC TCC GAC CGC ATT GGC GCT GTT AGT CTC GAA GCG TCG GCC TAC 

RIGGSDRIGAVSLEASAY 
E SAAPTALALLVSKRRPT 
NRRLRPHWRC* SRSVGLP 

FSQVPSPHQFCPAENPRI 
SRSSLHP INSAPRRMRAF 
LVVPCTLSTPLLAG* EP S 

GTC TTG CTG ACC TGT CCA CTC CCT ACA ACC TTC GTC CCG CGG AGT AAG CCC GCT 
9945 9954 9963 9972 9981 9990 

CAG AAC GAC TGG ACA GGT GAG GGA TGT TGG AAG CAG GGC GCC TCA TTC GGG CGA 

QNDWTGEGCWKQGAS FGR 
R T T- G Q V R D VGSRAPH S GE 
E R L D R * G £m) LEAGRLIRAN 
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VRHQG IAAGDGELLDVT 
SGT SV *RPATERWST SPP 
HGPASRDRRRRGGPPrrh 

TAC TGG GCC ACG ACT GGA TAG CGC CGC GGC AGA GGG AGG TCC TCC AGC TGC CAC 
9999 10008 10017 10026 10035 10044 

ATG ACC CGG TGC TGA CCT ATC GCG GCG CCG TCT CCC TCC AGG AGG TCG ACG GTG 

MTRC*PIAAPSPSRRSTV 
* P G A D L SRRRLPPGGRR W 
DPVLTYRGAVSLQEVDGG 

YRGP SYRKLFPVQEKGLA 
I AGQR I G K * S RCRNK G S P 
FLARAFVKEPVAGTRERP 

CTT ATC GCG GGA CCG CTT ATG GAA AAG TCC TTG CCG TGG ACA AGA AAG GGC TCC 
10053 10062 10071 10080 10089 10098 

GAA TAG CGC CCT GGC GAA TAC CTT TTC AGG AAC GGC ACC TGT TCT TTC CCG AGG 

E*RPGEYLFRNGTCSFPR 
NSALANTFSGTAPVL SRG 
IAPWRIPFQERHLFFPEG 

AHSAGRHRRPHPDSE PGV 
PTPRAAI GVPTRTVKRVS 
RRPVRRSASPPAP*KGSR 

CGC CGC ACC CTG CGC GGC GCT ACG GCT GCC CCC ACG CCC AGT GAA AGG CCT GGC 
10107 10116 10125 10134 10143 10152 

GCG GCG TGG GAC GCG CCG CGA TGC CGA CGG GGG TGC GGG TCA CTT TCC GGA CCG 

AAWDAPRCRRGCGSLSGP 
RRGTRRDADGGAGHF PDR 
GVGRAAMPTGVRVTFRTD 

GLPECEPVRGTRGGLHRA 
ASPSANRYAAR GAGS I GP 
RRPARMGTRPGDQGR SAP 

TGC GGC TCC CCG AGC GTA AGG CCA TGC GCC GGG CAG GAC GGG GGC TCT ACG GCC 
10161 10170 10179 10188 10197 10206 

ACG CCG AGG GGC TCG CAT TCC GGT ACG CGG CCC GTC CTG CCC CCG AGA TGC CGG 

TPRGSHSGTRPVLPPRCR 
RRGARI PVRGPSCPRDAG 
AEGLAFR YAARPAPEMPG 

RGLRRVDVYSHVALRDGA 
GGSVACTSTRTSPLGTAL 
GARS PARRRVLPRCAPR W 

CGG GCG GGC TCT GCC GCG TGC AGC TGC ATG CTC ACC TGC CGT TCG GCC AGC GGT 
10215 10224 10233 10242 10251 10260 

GCC CGC CGG AGA CGG CGC ACG TCG ACG TAC GAG TGG ACG GCA AGC CGG TCG CCA 
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A R P R R R- T S" T YEW T A S ' R S P 
PARDGARRRTSGRQAGRQ 
PPETAHVDV RVDGKPVAS 

EGQHGVPLDVRAPDPCQR 
RGRTVSRSTWVHRTPASG 
GGGPSRGPPGCTGPRPVA 

CGG AGG GGG ACC ACT GGC TGG CCC TCC AGG TGT GCA CGG CCC AGC CCC GTG ACG 
10269 10278 10287 10296 10305 10314 

GCC TCC CCC TGG TGA CCG ACC GGG AGG TCC ACA CGT GCC GGG TCG GGG CAC TGC 

ASPW* PTGRSTRAGS GHC 
PPPGDRPGGPHVPGRGTA 
LPLVTD REVHTCRVGALP 

AAAVAKHLQPQGAQVLED 
PPLSRRTSSHSGPRFWNT 
P RCRGGQPATAARGS GTR 

GCC CGC CGT CGC TGG CGG AAC ACC TCG ACA CCG ACG GGC CGG ACT TGG TCA AGC 
10323 10332 10341 10350 10359 10368 

CGG GCG GCA GCG ACC GCC TTG TGG AGC TGT GGC TGC CCG GCC TGA ACC AGT TCG 

RAAATALWSCGCPA* TSS 
GRQRPPCGAVAARPE PVR 
GGSDRLVELWLPGLNQFV 

Q V A H L * R CAGLHA P V GM G 
R C P T S N G A P A S T P R S V W V 
GARRP T VP LRRP P GP CGY 

AGG ACG TGC CGC ACC TCA ATG GCC GTC CGC GGC TCC ACC CGG CCC TGT GGG TAT 
10377 10386 10395 10404 10413 10422 

TCC TGC ACG GCG TGG AGT TAC CGG CAG GCG CCG AGG TGG GCC GGG ACA CCC ATA 

SCTAWSYRQAPRWAGTP I 
PARRGVTGRRRGGPGHPY 
LHGVELPAGAEVGRDTHT 

RGAPDVVPGGLRLAS P R Q 
AGRQTW*PAESDCPLPAS 
RAGSPGSRPRRTAPCLPA 

GGC GCG GGG CGA CCC AGG TGA TGC CCC GGA GGC TCA GCG TCC CGT CTC CCC GCG 
10431 10440 10449 10458 10467 10476 

CCG CGC CCC GCT GGG TCC ACT ACG GGG CCT CCG AGT CGC AGG GCA GAG GGG CGC 

PRPAGS TTGPPSRRAEGR 
RAPLGPLRGLRVAGQRGA 
APRWVHYGASESQGRGAL 

RGGPVPGRGDGGFEPQVQ 
DGVRFQVAVTAVS SP SSR 
TAWGS S SRSRRWRVRAPG 



ACA GCG GGT GGG CCT TGA CCT GGC GCT GGC AGC GGT GGC TTG AGC CCG ACC TGG 
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10485 10494 10503 10512' 10521 10530 

TGT CGC CCA CCC GGA ACT GGA CCG CGA CCG TCG CCA CCG AAC TCG GGC TGG ACC 

CRPPGTGPRPSPPNS GWT 
VAHPELD RDRRHRTRAGP 
SPTRNWTATVATELGLDL 

GRQRDPRAAVELREERGQ 
VESAIPAPQ*RWGSKAVR 
SRAPSRPPSSGGAARRSG 

ACT GGA GCG ACC GCT AGC CCC GCC CGA CGA TGG AGG TCG GCG AGA AGC GCT GGG 
10539 10548 10557 10566 10575 10584 

TGA CCT CGC TGG CGA TCG GGG CGG GCT GCT ACC TCC AGC CGC TCT TCG CGA CCC 

*PRWRSGRAATSSRS SRP 
DLAGDRGGLLPPAALRDP 
TSLAIGAGCYLQPLFATL 

EAVQGGI QDRAHDAHVD I 
SRSRGASRIVHMTPMFM* 
AGRGARRDS*TCPRC S CR 

ACG AGG CGC TGG ACG GGC GGC TAG ACT AGT GCA CGT ACC AGC CGT ACT TGT AGA 
10593 10602 10611 10620 10629 10638 

TGC TCC GCG ACC TGC CCG CCG ATC TGA TCA CGT GCA TGG TCG GCA TGA ACA TCT 

CSATCPP I * SRAWSA * T S 

APRPARRSDHVHGRHEHL 
LRDLPADL I TCMVGMN I Y 

ARTGQVLEGVPRVQDPQD 
PARARFWNV*RGFRTPST 
HRAHGSGT*R GAS GP RAP 

TAC CGC GCG CAC GGG ACT TGG TCA AGT GGA TGG CCG GCT TGG ACC AGC CCG ACC 
10647 10656 10665 10674 10683 10692 

ATG GCG CGC GTG CCC TGA ACC AGT TCA CCT ACC GGC CGA ACC TGG TCG GGC TGG 

MARVP*TSSPTGRTWSGW 
WRACPEPVHLPAEPGRAG 
GARALNQFTYRPNLVGLV 

PDDPL SVGRGRQDDRGVV 
RIMRSRCGEVGSTMADWW 
GS*GPAVGRSGAP*RTGG 

AGG CCT AGT AGG CCC TCG CTG TGG GGA GCT GGG GCG ACC AGT AGC GCA GGG TGG 
10701 10710 10719 10728 10737 10746 

TCC GGA TCA TCC GGG AGC GAC ACC CCT CGA CCC CGC TGG TCA TCG CGT CCC ACC 

SGSSGSDTPRPRWSSRPT 
PDHPGATPLDPAGHRVPP 
RIIRERHPSTPLVIASHH 

V R — • G PVVRQFSVAVQGQRL 
*EGQCSGSSPSP*RDKVS 
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TGA TGA GCG GGA CCG TGC TGG GCG ACC TTC CTC TGC CGA TGG ACA GGA ACT GCC 
10755 10764 10773 10782 10791 10800 

ACT ACT CGC CCT GGC ACG ACC CGC TGG AAG GAG ACG GCT ACC TGT CCT TGA CGG 

TTRPGTTRWKETATCP * R 
LLALARPAGRRRLPVLDG 
YSPWHDPLEGDGYLSLTE 

DPLLGTLHDIQQARVAVL 

TRSCVRSTTSRSR ASPSS 
PGPASGHPPRDAARPRrr 

TCC AGG CCC TCG TCT GGG CAC TCC ACC AGC TAG ACG ACG CGC GCC TGC CGC TGC 
10809 10818 10827 10836 10845 10854 

AGG TCC GGG AGC AGA .CCC GTG AGG TGG TCG ATC TGC TGC GCG CGG ACG GCG ACG 

RSGSRPVRWSICCARTAT 
GPGADP*GGRSAARGRRR 

VREQTREVVDLLRADGDE 

VDVVDVARAEGAGFGGVQ 
F T W * TWPGLRAPGSVAWR 
SRGSRGRGSGRRGRFRGG 

TCT TGC AGG TGA TGC AGG TGC CGG GCT CGG AGC GGC CGG GGC TTT GGC GGG TGG 
10863 10872 10881 10890 10899 10908 

AGA ACG TCC ACT ACG TCC ACG GCC CGA GCC TCG CCG GCC CCG AAA CCG CCC ACC 

RTSTTSTARASPAPKPPT 
ERPLRPRPEPRRPRNRpp 

NVHYVH GPSLAGPETAHL 

VDLRPVGIRQVEVLLPVV 
YTSGRYVSGSCKLWSPCS 
TRRAATCRDAAS*GPPAR 

ACA TGC AGC TCG GCG CCA TGT GGC TAG GCG ACG TGA AGT TGG TCC TCC CCG TGC 
10917 10926 10935 10944 10953 10962 

TGT ACG TCG AGC CGC GGT ACA CCG ATC CGC TGC ACT TCA ACC AGG AGG GGC ACG 

CTSSRGTPIRCTSTRRGT 
VRRAAVHRSAALQPGG AR 
YVEPRYTDPLHFNQE GHD 

QQRGSELPLEHLQHRVQH 
RSAAAKWRFSTSSTGSRT 
GAPPRKGASARPAPAP GP 

TGG ACG ACC GCC GGC GAA AGG TCG CCT TCG AGC ACC TCG ACC ACG GCC TGG ACC 
10971 10980 10989 10998 11007 11016 

ACC TGC TGG CGG CCG CTT TCC AGC GGA AGC TCG TGG AGC TGG TGC CGG ACC TGG 

TCWRPLSSGSSWSWCRTW 
PA.GGRFPAEARGAGAGPG 
LLAAAFQRKLVELVPDLV 
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PGSERVRGALCQPDL FGR 
RDQSGSEGRLASRI * SGA 
ATRVGPSEGCPVASRPVR 



ACG CCA GGA CTG AGG GCC TGA GAG GGG CGT TCC GTG ACG CCT AGA TCC TTG GGC 
11025 11034 11043 11052 11061 11070 

TGC GGT CCT GAC TCC CGG ACT CTC CCC GCA AGG CAC TGC GGA TCT AGG AAC CCG 




GCC TGC ATA GCC CAC CTA CCA GCC TAG GGA GAC GTA GCG GCT ACA CAG GCC CTT 
11079 11088 11097 11106 11115 11124 

CGG ACG TAT CGG GTG GAT GGT CGG ATC CCT CTG CAT CGC CGA TGT GTC CGG GAA 

RTYRVDGRIPLHRRCVRE 
GRIGWMVGSLCIADVSGK 
DVSGGWSDPSASPMCPGS 

RPRLCGTRGSSPIRGRAE 
GHAFAVLGAQLRSEVGLK 
GTPSPL WDPRFVPNSGS S 

CGG GCA CCC GCT TCC GTT GGT CAG GCC GGA CTT CTG CCC TAA GCT GGG GCT CGA 
11133 11142 11151 11160 11169 11178 

GCC CGT GGG CGA AGG CAA CCA GTC CGG CCT GAA GAC GGG ATT CGA CCC CGA GCT 

ARGRRQPVRPEDGIRPRA 
PVGEGNQSGLKTGFDP-EL 
P WAKA T S P A * R R D S T P S F 

GT DP GY S GQRHARH GRAA 
ALIQAMHAKVTRETVGLL 
RWYRPWILRSPASPSGSC 

AGC GGT CAT AGA CCC GGT ATA CTC GGA ACT GCC ACG CGA GCC ACT GGG GCT CGT 
11187 11196 11205 11214 11223 11232 

TCG CCA GTA TCT GGG CCA TAT GAG CCT TGA CGG TGC GCT CGG TGA CCC CGA GCA 

SPVSGPYEP*RCAR*PRA 
RQYL GHMSL DGALGDPE Q 
ASIWAI*ALTVRSVTPSS 

RRD*PQLLRPEAPPLGPA 
AAIERNSYGHSLLLFVQL 
RPSRVTPTATA*CSSSRS 



CGC GCC GCT AGA GTG CCA ACC TCA TCG 
11241 11250 11259 

GCG CGG CGA TCT CAC GGT TGG AGT AGC 



GCA CCG AGT CGT CCT CCT TCT GGA CCT 
11268 11277 11286 

CGT GGC TCA GCA GGA GGA AGA CCT GGA 



-44- 



A R R S H* G W S S R G S" A G G R" P G 
RGDLTVGVAVAQQEEDLE 
A A I SRLE*PWLSRRKTWS 

RPRLTFTGPQARGAL PVP 
ERDSLLHVQSLGELWPFQ 
SATPSYIYRASGKWGP S S 

CGA GCG CCA GCC TCT CAT TTA CAT GGA CCG ACT CGG GAA GGT CGG TCC CCT TGA 
11295 11304 11313 11322 11331 11340 

GCT CGC GGT CGG AGA GTA AAT GTA CCT GGC TGA GCC CTT CCA GCC AGG GGA ACT 

ARGRRVNVPG*AL PARGT 
LAVGE*MYLAEPFQPGEL 
SRSESKCTWLSPSSQGNW 

GRPSI SRRWF*QFRLRFI 
DEHLFRDDGSDSSDCGSY 
TRTSFDI TALIVP IAAP I 

CCA GGA GCA CCT CTT TAG CTA GCA GCG GTC TTA GTG ACC TTA GCG TCG GCC TTA 
11349 11358 11367 11376 11385 11394 

GGT CCT CGT GGA GAA ATC GAT CGT CGC CAG AAT CAC TGG AAT CGC AGC CGG AAT 

GPRGE I DRRQNHWNR SRN 
VLVEKS IVARITG I A A G I 
SSWRNRSSPESLESQPEY 

AFDPGRI LTHDKCARLP * 
PLTQGGYSRTTRAHGLLD 
HCLRAGTHAHPGQMG* ST 

TAC CGT TTC AGA CCG GGG GCA TAC TCG CAC ACC AGG AAC GTA CGG GAT TCT CCA 
11403 11412 11421 11430 11439 11448 

ATG GCA AAG TCT GGC CCC CGT ATG AGC GTG TGG TCC TTG CAT GCC CTA AGA GGT 

MAKSGPRMSVWSLHALRG 
WQSLAPV*ACGPCMP *EV 
GKVWPPYERVVLACPKRS 

GVCRTDLRRLAGGSF * S S 
DSADL I LAGFPAVVS SHL 
MRRMSY*PASPRWWQVI F 

GTA GGC TGC GTA GCT CAT AGT TCC GCG GCT TCC CGC GGT GGT GAC TTG ATA CTT 
11457 11466 11475 11484 11493 11502 

CAT CCG ACG CAT CGA GTA TCA AGG CGC CGA AGG GCG CCA CCA CTG AAC TAT GAA 

HPTHRV S RRRRAPPLNYE 
IRRIEYQGAEGRHH* TMK 
SDASSIKAPKGATTEL*R 

TLAIGGMRRIPGPC* EDQ 
RSPSVVWAVFPDQVNSMK 
VHPRYWGHS SHTR S M V * R 



CTG CAC TCC CGC TAT GGT GGG TAC GCT GCT TAC CCA GGA CCT GTA ATG AGT AGA 
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11511 11520' 11529 11538 11547 11556 

GAC GTG AGG GCG ATA CCA CCC ATG CGA CGA ATG GGT CCT GGA CAT TAC TCA TCT 



DVR A I PPMRRMGP GHY S S 
T*GRYHPCDEWVLDI THL 
REGDTTHATNGSWTLLIL 

DD*RM*PRTPAGQHRRSD 
IMK D CRRGPQPAK T G GAT 
S * R I ADVAPNPRRPAAQQ 

ACT AGT AGA ATA GCG TAG ATG CCG GCC CAA CCC CGC GGA ACC ACG GCG GAC GAC 
11565 11574 1 1583 11592 11601 1 1610 

TGA TCA TCT TAT CGC ATC TAC GGC CGG GTT GGG GCG CCT TGG TGC CGC CTG CTG 

*SSYRIYGRVGAPWCRLL 
DHLIASTAGLGRLGAACC 
IILSH LRPGWGALVPPAV 

HAP GAS AHALRI LRGTGP 
TLLARRPTPLASLAARAR 
RSCPGGLRPCPPYPPGHG 

AGC ACT CGT CCC GGG CGG CTC CGC ACC CGT TCC GCC TAT TCC GCC GGG CAC GGG 
11619 11628 11637 11646 11655 11664 

TCG TGA GCA GGG CCC GCC GAG GCG TGG GCA AGG CGG ATA AGG CGG CCC GTG CCC 

S*AGPAEAWARRI RRPVP 
REQGPPRRGQGG* GGPCP 
VSRARRGVGKADKAARAR 



T H V" A IVGSPVRSRTRRAG 
H T C P (l) *APLFAAVPGGPA ^~ , 
THARCDRRFSRP* PDAQR 

CCA CAC ACG TGC CGT TAG TGC GGC CTT CCT TGC GCC GAT GCC CAG GCG GAC CGC 
11673 11682 11691 11700 11709 11718 

GGT GTG TGC ACG GCA ATC ACG CCG GAA GGA ACG CGG CTA CGG GTC CGC CTG GCG 

GVCTAI TPEGTRLRVRLA 
VCARQSRRKERGYGSAWR 
CVHGNHAGRN AATGP PGA 

GRGPAPSAGRLIRCGPPR 
VAGLRRHHVEFFGADRRG 
WRAWAGT I CRSSDPMGAA 

GGT GGC GCG GGT CCG CGG CCA CTA CGT GGA GCT TCT TAG GCC GTA GGG CCG CCG 
11727 11736 11745 11754 11763 11772 

CCA CCG CGC CCA GGC GCC GGT GAT GCA CCT CGA AGA ATC CGG CAT CCC GGC GGC 

PPRPGAGDAPRRI RHPGG 
HRAQAPVMHLEESGI PAA 
TAPRRR*CTSKNPAS RRP 

G A *wR FRPADGAKTPRGHAG 
AQGSVPRTVQKPRGAMRA 
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P R G Q F P A R * R S Q D A P W A R 



GCC GGA CGG GAC TTT GCC CCG CGC AGT GGA CGA AAC CAG CCG GCC GGT ACG CGC 
11781 11790 11799 11808 11817 11826 

CGG CCT GCC CTG AAA CGG GGC GCG TCA CCT GCT TTG GTC GGC CGG CCA TGC GCG 

RPALKRGASPALVGRPCA 
GLP* NGARHLLWSAGHAR 
ACPETGRVTCFGRPAMRA 

RL*RITAPYIFVRKSLSE 
GYDVSRQPIYSFGNRYVK 
GTILPDNRSIHFGTE IFK 

GGG GCA TTA GTT GCC TAG CAA CGC CCT ATA TAC TTT TGG GCA AAG CTA TTT GAA 
11835 11844 11853 11862 11871 11880 

CCC CGT AAT CAA CGG ATC GTT GCG GGA TAT ATG AAA ACC CGT TTC GAT AAA CTT 

PRNQRI VAGY MKTRFDKL 
PVINGSLRDI*KPVS INF 
P*STDRCGIYENPFR*TF 

CQRCARKTWSPSSPAR*R 
ANAVHANQGARRRLRGSG 
RMPSMRTKDLEAVFAGAV 

AGC GTA ACC GCT GTA CGC GCA AAA CAG GTC GAG CCG CTG CTT CCG CGG GCG ATG 
11889 11898 11907 11916 11925 11934 

TCG CAT TGG CGA CAT GCG CGT TTT GTC CAG CTC GGC GAC GAA GGC GCC CGC TAC 

SHWRHARFVQLG DE GARY 
RIGDMRVLSSSATKAPAT 
ALAT CAFCPARRRRRp LP 

GHCH SLQRTGASGQPAVG 
GTVTA*NVREQLVRPPWV 
ARSLPE I SANRCFGPPGC 

GCG GGC ACT GTC ACC GAG TTA ACT GCG CAA GGA CGT CTT GGG ACC CCC CGG TGT 
11943 11952 11961 11970 11979 11988 

CGC CCG TGA CAG TGG CTC AAT TGA CGC GTT CCT GCA GAA CCC TGG GGG GCC ACA 

RP*QWLN*RVPAEPWGAT 
ARDS GS IDAFLQNPGGPH 
PVTVAQLTRSCRTLGGHT 

RIEPNGARLGQRRPRHPQ 
ESRL I GLAYAKAVLA TRN 
RPD* SEWRTPRPSSPPAT 

GGA GCC TAG AGT CCT AAG GGT CGC GCA TCC GGA ACC GCT GCT CCC GCC ACG CCA 
11997 12006 12015 12024 12033 12042 

CCT CGG ATC TCA GGA TTC CCA GCG CGT AGG CCT TGG CGA CGA GGG CGG TGC GGT 

PR I S G F P ARRPWRR G R C G 
L G «& Q D S QRVGLGDE G G A V 
SDLR I PSA*ALATRAVRL 
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AGPLAGDDQQRPVRGGPP 
PVRFRE MMKSVHYEVGQR 
PCGSASW*RASTTSSGRA 



ACC CGT GGG CCT TCG CGA GGT AGT AGA ACG ACT GCA CCA TGA GCT GGG GGA CCG 
12051 12060 12069 12078 12087 12096 

TGG GCA CCC GGA AGC GCT CCA TCA TCT TGC TGA CGT GGT ACT CGA CCC CCT GGC 

WAPGSAPSSC*RGTRPPG 
GHPEALHHLADVVLDP LA 
GTRKRS I ILLTWYS TPWR 

QPLAQQRHLHHA*RRRHT 
SLYLKSAICTTREGAAIR 
ASTSSAPSAPPASVQP S A 

CCG ACT CCA TCT CGA ACG ACC GCT ACG TCC ACC ACG CGA GTG GAC GCC GCT ACG 
12105 12114 12123 12132 12141 12150 

GGC TGA GGT AGA GCT TGC TGG CGA TGC AGG TGG TGC GCT CAC CTG CGG CGA TGC 




CAA GCT ACT AGA ACC GCA GGT CCG ACC TAT TCC AGC ACC CCC GCC AAG AGT GGA 
12159 12168 12177 12186 12195 12204 

GTT CGA TGA TCT TGG CGT CCA GGC TGG ATA AGG TCG TGG GGG CGG TTC TCA CCT 

VR*S WRPGWIRSWGRFSP 
FDDLGVQAG*GRGGGSHL 
SMI LASRLDKVVGAVL TW 

VGQPFLASLHRSRRPPVL 
YERPSSHQSTDLAGPRSW 
TSGPPLTSLPTSLAPAPG 

CCA TGA GGG ACC CCC TTC TCA CGA CTC TCC ACA GCT CTC GCG GCC CCG CCC TGG 
12213 12222 12231 12240 12249 12258 

GGT ACT CCC TGG GGG AAG AGT GCT GAG AGG TGT CGA GAG CGC CGG GGC GGG ACC 




TCC GTG GCC GCC GAC TGA GGA AAC ATG 
12267 12276 12285 

AGG CAC CGG CGG CTG ACT CCT TTG TAC 



GGT TGT GAG CAA GTG GTC GTC ATC ACC 
12294 12303 12312 

CCA ACA CTC GTT CAC CAG CAG TAG TGG 
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R H R R Ei T P I, Y F T L V H Q Q * W 
GTGG*LLCTQHSFTSS SG 
APAADSFVP'NTRSPAVVD 

KT*TGTATRPCQTTRAFP 
KREPAPRPEQVNPQELLH 
SENLHRDRNKSMPNNS C I 

TGA AAG CAA GTC CAC GGC CAG CGC CAA GAA CCT GTA ACC CAA CAA GCT CGT TTA 
12321 12330 12339 12348 12357 12366 

ACT TTC GTT CAG GTG CCG GTC GCG GTT CTT GGA CAT TGG GTT GTT CGA GCA AAT 

TFVQVPVAVLGHWVVRAN 
LSFRCRSRFLDIGLFEQM 
FRSGAGRGSWTLGCS SKW 

AP KPPRRGASRVE RDHRD 
PPNRPGAAPQGSKVI MAT 
PRTEPAQPRSVP S * S * P P 

CCC CGC CCA AAG CCC CCG GAC GCC GGC CGA CTG GCC TGA AGT GCT AGT ACC GCC 
12375 12384 12393 12402 12411 12420 

GGG GCG GGT TTC GGG GGC CTG CGG CCG GCT GAC CGG ACT TCA CGA TCA TGG CGG 

GAGFGGLRPADRTSRSWR 
GRVSGACGRLTGLHDHGG 
GGFRGPAAG*P D FT IMAV 

ALPQSPETTSASRPTVAA 
RLLSRRSPLQPAGPHLPR 
GCSAAVARYNLREPTYRG 

AGG CGT TCT CCG ACG CTG CCG AGC CAT CAA CTC CGC GAG GCC CCA CAT TGC CGG 
12429 12438 12447 12456 12465 12474 

TCC GCA AGA GGC TGC GAC GGC TCG GTA GTT GAG GCG CTC CGG GGT GTA ACG GCC 

SARGCD GSVVEALRGV TA 
PQEAATAR*LRRSGV*RP 
RKRLRRLGS*GAPGCNGR 



DRATAHGNRGRFRPYCAD 
MGRQPT GTGAAFGRTVP (m) 
CGASHRAREPRSVAPL LC 

CGT AGG GCG CGA CAC CGC ACG GGC AAG GCC GGC GCT TTG GCG CCC ATT GTC CGT 
12483 12492 12501 12510 12519 12528 

GCA TCC CGC GCT GTG GCG TGC CCG TTC CGG CCG CGA AAC CGC GGG TAA CAG GCA 

ASRAVACPFRPRNRG* QA 
HPALWRARSGRETAGNRH 
IPRCGVPVPAAKPRVTGI 

PRGS FERSTVRHQRRVP G 
QGAPFSAPR*ATNDAS PV 
RAPRFVRPVDRPTTPPRS 



AGA CCG GCC GGC CTT TTG AGC GCC CTG CAG TGC GCC ACA ACA GCC GCC TGC CCT 
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12537 12546~ 12555 1256"4 12573 12 582 

TCT GGC CGG CCG GAA AAC TCG CGG GAC GTC ACG CGG TGT TGT CGG CGG ACG GGA 

SGRPENSRDVTRCCRRTG 
LAGRKTRGTSRGVVGGRD 
WPAGKLAGRHAVLSADGT 

SDHAGGVPSSIEKCTGTK 
RIMPAASLVLFKRVRARR 
GF*PRRRCS*FNG*VHGD 

GGG CTT AGT ACC CGC GGC GGC TGT CCT GAT CTT TAA AGG AAT GTG CAC GGG CAG 
12591 12600 12609 12618 12627 12636 

CCC GAA TCA TGG GCG CCG CCG ACA GGA CTA GAA ATT TCC TTA CAC GTG CCC GTC 

PESWAPPTGLEISLHVPV 
PNHGRRRQD*KFPYTCP S 
RIMGAADRTRNFLTRARL 

DEVGAFRHRPVLPSPMF I 
IRSAQSDTAHFSHLRCSF 
*GRRRRIQPTSRTSVAHF 

AAT AGG AGC TGC GGA CGC TTA GAC ACC GCA CCT TGC TCA CCT CTG CCG TAC TTT 
12645 12654 12663 12672 12681 12690 

TTA TCC TCG ACG CCT GCG AAT CTG TGG CGT GGA ACG AGT GGA GAC GGC ATG AAA 

LSSTPANLWRGTSGDG (m) K V* J 
YPRRLR I CGVERVETA* K 
ILDACESVAWNEWRRHEN 

^> 

STSCGVQLRSVTRSPRPP 
RHAAASRYGPYPAPRARR 
DIHQLRGTVQI RHPVPAA 

TAG CTA CAC GAC GTC GGC TGG ACA TTG GAC CTA TGC CAC GCC CTG CCC GCG CCG 
12699 12708 12717 12726 12735 12744 

ATC GAT GTG CTG CAG CCG ACC TGT AAC CTG GAT ACG GTG CGG GAC GGG CGC GGC 

IDVLQPTCNLDTVRDGRG 
SMCCSRPVTWIRCGTGAA 
RCAAAD L *PGYGAGRARR 

IKVQTGGSGMRSNLI SCR 
FK*RPGGPAWGPI * Y A A G 
SNEGPDGRLGDQFEIHQV 

CCT TAA AAG TGG ACC CAG GGG GGC CTC GGG TAG GAC CTT AAG TTA TAC GAC GTG 
12753 12762 12771 12780 12789 12798 

GGA ATT TTC ACC TGG GTC CCC CCG GAG CCC ATC CTG GAA TTC AAT ATG CTG CAC 

GIFTWVPPEPILEFNMLH 
EFSPGSPRSPSWNSI CCT 
NFHLGPPGAHPGIQYAAP 

YG>wPFTRPRC**GCKTSYR 
TGPFPARGANDGASQRTG 
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Q V R S L H' A A Q M T V R V K D ' L 



GAC ATG GGC CCT TTC CAC GCG CCG GAC GTA ATA GTG GGC GTG AAA CAG CTC ATG 
12807 12816 12825 12834 12843 12852 

CTG TAC CCG GGA AAG GTG CGC GGC CTG CAT TAT CAC CCG CAC TTT GTC GAG TAC 

LYPGKVRGLHYHPHFVEY 
CTRERCAACIITRTLSST 
VPGKGARPALSPALCRVP 

SNTSPEPTSIVLSSASSG 
ATRRPSPRAS*WPRRR LG 

QQEDL ARAHQDGLVVGFV 

GAC GAC AAG CAG CTC CCG AGC CCG CAC GAC TAG TGG TTC CTG CTG CGG CTT CTG 
12861 12870 12879 12888 12897 12906 

CTG CTG TTC GTC GAG GGC TCG GGC GTG CTG ATC ACC AAG GAC GAC GCC GAA GAC 

LLFVEGSGVLITKDDAED 
CCSSRARAC*SPRTTPKT 
AVRRGLGRADHQGRRRRp 

LQLSSNMWTERPTQVLVG 
WSCLPI *GRRARPRCW SA 
GVAFLFE DVDRAPDAGPR 

GGG TTG ACG TTT CTC CTT AAG TAG GTG CAG AGC GCG CCC CAG ACG TGG TCC TGC 
12915 12924 12933 12942 12951 12960 

CCC AAC TGC AAA GAG GAA TTC ATC CAC GTC TCG CGC GGG GTC TGC ACC AGG ACG 

PNCKEEFIHVSRGVCTRT 
PTAKRN S S T S RAG S AP GR 
QLQRGI HPRLA RGLHQDA 

APTMCE TW AMEDRVNMAM 
PRP*ASRGRWRTGST*RW 
RGPDHVGDVGDRGQREDG 

GGC CGG CCC CAG TAC GTG AGG CAG GTG CGG TAG AGC AGG GAC TGC AAG TAG CGG 
12969 12978 12987 12996 13005 13014 

CCG GCC GGG GTC ATG CAC TCC GTC CAC GCC ATC TCG TCC CTG ACG TTC ATC GCC 

PAGVMHSVHAISSLTF IA 
RPGSCTPS TPSRP*RS SP 
GRGHALRPRHLVPDVHRH 

SVLGQSSHSGGST*TSGS 
A*WARPRIRDAAPEPRAA 
HEGLGPVFAIRRQNLDLR 

TAC GAG TGG TTC GGG ACC CTG CTT ACG CTA GGC GGC GAC CAA GTC CAG CTC GGC 
13023 13032 13041 13050 13059 13068 

ATG CTC ACC AAG CCC TGG GAC GAA TGC GAT CCG CCG CTG GTT CAG GTC GAG CCG 

MLTK PWDECDPPLVQVEP 
CS.PSPGTNAIRRWFRS SR 
AHQALGRMRSAAGSGRAA 
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GCVSSRGHPDGHDAGPPE 
AACA.PAGTLTATTPAP PN 
QRVRQLARSPRRPRRRp T 

GAC GGC GTG TGC GAC CTC GCG GGC ACT CCC AGC GGC ACC AGC CGC GGC CCC CCA 
13077 13086 13095 13104 13113 13122 

CTG CCG CAC ACG CTG GAG CGC CCG TGA GGG TCG CCG TGG TCG GCG CCG GGG GGT 

LPHTLERP*GSPWSAPGG 
C R T R W S A 1^ EGRRGRRR GV 

aahagap(v)r vavvga G GF 



DARGDGPCQTGRGNGHRT 
TPVATVRASPEAAMGTVR 
RRCPR*GPVPNRPWER SA 

AGC AGC CGT GCC GGC AGT GGG CCC GTG ACC CAA GGC GCC GGT AAG GGC ACT GCG 
13131 13140 13149 13158 13167 13176 

TCG TCG GCA CGG CCG TCA CCC GGG CAC TGG GTT CCG CGG CCA TTC CCG TGA CGC 

SSARPSPGHWVPRPFP * R 
RRHGRHPGTGFRGHSRDA 
VGTAVTRALGSAAI PVTR 

GVVLL CATAAGEVHQDVR 
AL*S SARRLPGKSTST LA 
HWSRPPVGYRGRRRAP *R 

CAC GGT TGA TGC TCC TCC GTG CGG CAT CGC CGG GGA AGC TGC ACG ACC AGT TGC 
13185 13194 13203 13212 13221 13230 

GTG CCA ACT ACG AGG AGG CAC GCC GTA GCG GCC CCT TCG ACG TGC TGG TCA ACG 

VPTTRRHAVAAPSTCWST 
CQLRGGTP*RPLRRAGQR 
ANYE EARRSGPFDVLVNA 

GAGGP TVPGPLVGVVVAA 
AQGERR*QARCCGSS SRR 
PRGRGANSPGAAGRRRGG 

GCC GGA CGG GGA GGG CCG CAA TGA CCC GGG CCG TCG TGG GGC TGC TGC TGG CGG 
13239 13248 13257 13266 13275 13284 

CGG CCT GCC CCT CCC GGC GTT ACT GGG CCC GGC AGC ACC CCG ACG ACG ACC GCC 

RPAPPGVTGPGSTPTTTA 
GLPLPALLGPAAPRRRPp 

ACPSRRYWARQHPDDDR R 

LRDVLGPREKAVPLPVAE 
SVTSLVRASRRSQSHSRK 
RSPRCSGPAGERSPTPGS 

CGC TCT GCC AGC TGT TCT GGG CCC GCG AGG AAG CGC TGA CCC TCA CCG TGG CGA 
13293 13302 13311 13320 13329 13338 

GCG AGA CGG TCG ACA AGA CCC GGG CGC TCC TTC GCG ACT GGG AGT GGG ACC GCT 
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A R R : S T R P G R S F A T G S G T A 
RDGRQDPGAPSRLGVGPL 
ETVDKTRALLRDWEWDRF 

DLDAGDGRAGLQVGGVAP 
TWILVMEARVWSSVG*PR 
RGS * CWRRACGAPCGRRG 

AGC AGG TCT AGT CGT GGT AGA GGC GCG CGT GGG TCG ACC TGT GGG GGA TGC CGG 
13347 13356 13365 13374 13383 13392 

TCG TCC AGA TCA GCA CCA TCT CCG CGC GCA CCC AGC TGG ACA CCC CCT ACG GCC 

SSRSAPSPRAPSWTPPTA 
RPDQHHLRAHPAGHPLRP 
VQISTI SARTQLDTPYGR 

VPGL GLLEARAMQDDAQA 
FRASASSSQAPWRTTRRP 
SGPRPRPARRP GDPRGGP 

CCT TGG CCC GGC TCC GGC TCC TCG AGA CGC GCC CGG TAG ACC AGC AGG CGG ACC 
13401 13410 13419 13428 13437 13446 

GGA ACC GGG CCG AGG CCG AGG AGC TCT GCG CGG GCC ATC TGG TCG TCC GCC TGG 

GTGPRPRSS ARA IWS SAW 
EPGRGRGALRGPSGRPPG 
NRAEAEELCAGHLVVRLG 

GHVAVAVGLANEDVDEFL 
GMYP SLLVLPTRMSMR S S 
GWTRRCCCWPRE * R C G R L 

CGG GGT ACA TGC CGC TGT CGT TGT GGT TCC CGC AAG AGT AGC TGT AGG AGC TTC 
13455 13464 13473 13482 13491 13500 

GCC CCA TGT ACG GCG ACA GCA ACA CCA AGG GCG TTC TCA TCG ACA TCC TCG AAG 

APCTATATPRAFS ST S S K 
PHVRRQQHQGRSHRHPRR 
PMYGDSNTKGVL ID ILEE 

LGDVRVALRALAERRDLP 
CGT * ACPSDRWLKAGT S H 
AARRRARRTAGS SRAPRT 

TCG TCG GGC AGA TGC GCG TGC CGC TCA GCG CGG TCT CGA AGC GCG GCC AGC TCA 
13509 13518 13527 13536 13545 13554 

AGC AGC CCG TCT ACG CGC ACG GCG AGT CGC GCC AGA GCT TCG CGC CGG TCG AGT 

SSPSTRTA SRARASRRS S 
AARLRARRVAPELRAGRV 
QPVYAHGESRQSFAPVEW 

AAAPHGGVEVGLPQPLHP 
HPPQTAEWRSASPSHSTP 
TRRSPPRGGRRRPATPPP 



CCA CGC CGC CGA CCC ACC GGA GGG TGG AGC TGC GGC TCC CCG ACA CCC TCC ACC 
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T3563 13572 13581 13590 13599 13608 

GGT GCG GCG GCT GGG TGG CCT CCC ACC TCG ACG CCG AGG GGC TGT GGG AGG TGG 



GAAAGWPPTSTPRGCGRW 
VRRLGGLPPRRRGAVGGG 
CGGWVASHLDAEGLWEVG 

RPRRDAQPLDPVRDTRTG 
ARVVTLRRSILSATPERE 
PA SSP*GAPS*PRPRNAN 

CCC GCG CCT GCT GCC AGT CGG ACG CCC TCT AGT CCC TGC GCC AGC CAA GCG CAA 
13617 13626 13635 13644 13653 13662 

GGG CGC GGA CGA CGG TCA GCC TGC GGG AGA TCA GGG ACG CGG TCG GTT CGC GTT 

GRGRRSACGRSGTRSV.RV 
GADDGQ PAGDQGRGRFAF 
ARTTVSLREIRDAVGSRS 

DEGAGALVVLEGQDAFGV 
TKAPAR L SSWNGRT L S G S 
RRRRRGCPRGTGGP * RVR 

GGC AGA AGC GGC CGC GGG CGT TCC TGC TGG TCA AGG GGG ACC AGT CGC TTG GGC 
13671 13680 13689 13698 13707 13716 

CCG TCT TCG CCG GCG CCC GCA AGG ACG ACC AGT TCC CCC TGG TCA GCG AAC CCG 

PSSPAPARTTSSPWSANP 
RLRRRPQGRPVPPGQRTR 
VFAGARKDDQFPLVSEPD 

PRVGCI DDAPEPGTAS CQ 
QGSAAS TMPQSLARLRAS 
SAPRRL H * R S A * P GY GL V 

TGA CCG GCC TGC GGC GTC TAC AGT AGC CGA CCG AGT CCC GGG CAT CGG CTC GTG 
13725 13734 13743 13752 13761 13770 

ACT GGC CGG ACG CCG CAG ATG TCA TCG GCT GGC TCA GGG CCC GTA GCC GAG CAC 

TGRTPQMSSAGSGPVAEH 
LAGRRRCHRLAQGP*PST 
WPDAADVIGWLRARSRA L 

SSF*SCSRDSSR*RGNGS 
VPSDHARGTVRGDDVTAP 
SQLIMLVVP*EVTMSRQR 

ACT GAC CTC TTA GTA CTC GTG CTG GCC AGT GAG CTG GCA GTA GCT GGC AAC GGC 
13779 13788 13797 13806 13815 13824 

TGA CTG GAG AAT CAT GAG CAC GAC CGG TCA CTC GAC CGT CAT CGA CCG TTG CCG 



* L E N J* EHDRSLDRHRPLP 
D W R I (m) STTGHSTVIDRCR 
TGES*A|^PVTRPSSTVAG 

R R >-C C R T A A R A R G R V A P G * 
DAVVGL QQGHEVE SRLGE 
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I Q S L V S N S G T S S R P G *C A R 

CTA GAC GCT GTT GTG GCT CAA CGA CGG GCA CGA GCT GGA GCC TGG CGT CCG GGA 
13833 13842 13851 13860 13869 13878 

GAT CTG CGA CAA CAC CGA GTT GCT GCC CGT GCT CGA CCT CGG ACC GCA GGC CCT 

DLRQHRVAARARPRTAGP 
ICDNTELLPVL DLGPQAL 
SATTPSCCPCSTSDRRp< 

RRTGASGRRPRATREAP 2 
GA'HERPGAALVHRVNRQL 
VPTNGRVRPSSTG YTGS S 

GTG GCC GCA CAA GGG CGC CTG GGC GCC GCT CCT GCA CGG CAT GCA AGG CGA CCT 
13887 13896 13905 13914 13923 13932 

CAC CGG CGT GTT CCC GCG GAC CCG CGG CGA GGA CGT GCC GTA CGT TCC GCT GGA 

HRRVP A D P RRGRA VR S A G 
TGVFPRTRGEDVPYVPLE 
PACSRGPAARTCRTFRW£ 

PASSARRNRVPAAAGCRI 
QHAARGATAFQHLQAVGG 
STRQEGPPQSSTCS RWVA 

CGA CCA CGC GAC GAG CGG GCC GCC AAC GCT TGA CCA CGT CGA CGC GGT GTG GCG 
13941 13950 13959 13968 13977 13986 

GCT GGT GCG CTG CTC GCC CGG CGG TTG CGA ACT GGT GCA GCT GCG CCA CAC CGC 

AGALLARRLRTGAAAPHR 
LVRCSPGGCELVQLRHTA 
WCAARPAVANWCSCATPI 

SRG*TRRPSRSGTWG*G£ 
VEAEHVALAVAVPGAEVA 
SKPRMYPSP*P*RDLRLR 

GCT GAA GCC GGA GTA CAT GCC GCT CCC GAT GCC GAT GGC CAG GTC GGA GTT GGC 
13995 14004 14013 14022 14031 14040 

CGA CTT CGG CCT CAT GTA CGG CGA GGG CTA CGG CTA CCG GTC CAG CCT CAA CCG 

RLRPHVRRGLRLPVQPQp 
DFGLMYGEGYGYR SS LNR 
TSASCTARATATGPASTiV 

WPPGGAR-CPRRW*RGPRG 
GHRVVQAALDGGD GAQDV 

EMASWRRPLTAAMVPRTS 

GAG GTA CCG CCT GGT GGA CGC GCC GTT CCA GCG GCG GTA GTG GCC GGA CCA GCT 
14049 14058 14067 14076 14085 14094 

CTC CAT GGC GGA CCA CCT GCG CGG CAA GGT CGC CGC CAT CAC CGG CCT GGT CGA 

LHGGPPARQGRRHHRPQR 
SM.ADHLRGKVAAI TGLVD 

PWRTTCAARSPPSPAWST 
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RGRRGPRPCRCCRRC GAP 
EAGAVQDHVDAAVVAGQQ 
RPGPSRTTSMPLLSPVRS 

GGA GCC GGG GCC GCT GGA CCA GCA CCT GTA GCC GTC GTT GCT GCC GTG GGA CGA 
14103 14112 14121 14130 14139 14148 

CCT CGG CCC CGG CGA CCT GGT CGT GGA CAT CGG CAG CAA CGA CGG CAC CCT GCT 

PRPRRPGRGHRQQRRHPA 
LGPGDLVVDIGSNDGTLL 
SAPATWSWTSAATTAPCW 

PRGRRRAGGPRLPGRRWR 
RGVGGVPGAQDSHVGGGG 
AA*GASPGRRTPT SGAAV 

CCG CCG GAT GGG GCG GCT GCC CGG GGC GGA CCA GCC TCA CCT GGG GCG GCG GTG 
14157 14166 14175 14184 14193 14202 

GGC GGC CTA CCC CGC CGA CGG GCC CCG CCT GGT CGG AGT GGA CCC CGC CGC CAC 

GGLPRRRAPPGRSGPRRH 
AAYPADGPRLVGVDPAAT 
RPTPPTGPAWSEWTPPPP 

RRRTRGAPRRASGRS RRM 
DEGRGVR RADLQDGVEE C 
TKAAD*GGPTSSI GSKKA 

GCA GAA GCG GCG CAG GAT GGG CGG CCC GCA GCT CGA CTA GGG GCT GAA GAA GCG 
14211 14220 14229 14238 14247 14256 

CGT CTT CGC CGC GTC CTA CCC GCC GGG CGT CGA GCT GAT CCC CGA CTT CTT CGC 

RLRRVLPAGRRADPRLLR 
VFAASYPPGVELI PD FFA 
SSPRPTR RASS*SPTSSH 

RGARRAGRWPR*RSR STR 
VVQEAPAAGLDDGRD RHE 
YSRSPPRRALTTVE I A I N 

TAT GCT GGA CGA GCC GCC CGC GGC GCG GTT CCA GCA GTG GAG CTA GCG CTA CAA 
14265 14274 14283 14292 14301 14310 

ATA CGA CCT GCT CGG CGG GCG CCG CGC CAA GGT CGT CAC CTC GAT CGC GAT GTT 

IRPARRAPRQGRHLDRDV 
YD L L GGRRAKVVT S I AM F 

TTCSAGAAPRSSPRSRCS 

RGAADWPT*APPRGGASP 
VVQRTGHLEHPLDAAQQR 
*SRGRGMSNMRSTPRRSV 

GAT GCT GGA CGG CGC AGG GTA CCT CAA GTA CGC CCT CCA GCC GGC GGA CGA CTG 
14319 14328 14337 14346 14355 14364 

CTA CGA CGT GCC GCG TCC CAT GGA GTT CAT GCG GGA GGT CGG CCG CCT GCT GAC 
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YDLPRPMEFMREVGRLLT 
TTCRVPWSSCGRSAAC * 

RRCRPSRASSDARSAGR 

VVADPHGLLAIQGRHEVG 
SSPMQTVSCL*RGAI SWA 

CCT GCT GCC GTA GAC CCA CTG GCT CGT CTC GAT AGA CGG GCG CTA CGA GGT GCG 
14373 14382 14391 14400 14409 14418 

GGA CGA CGG CAT CTG GGT GAC CGA GCA GAG CTA TCT GCC CGC GAT GCT CCA CGC 

GRRHLGDRAELSARDAPR 
DDGIWVTEQSYLPAMLHA 
TTASG*PSRAICPRCSTP 

RRRRPRGRAGPSSRAAGS 
A GVVHDAVLVQVVVPQAL 
QA*STTQWSCRS* *PSRW 

GAC GCG GAT GCT GCA CCA GAC GGT GCT CGT GGA CCT GAT GAT GCC CGA CGC GGT 
14427 14436 14445 14454 14463 14472 

CTG CGC CTA CGA CGT GGT CTG CCA CGA GCA CCT GGA CTA CTA CGG GCT GCG CCA 

LRLRRGLPRAPGLLRAAP 
CAYDVVCHEHLDYYGLRQ 
APTTWSATSTWTTTGCAR 

RTSPRACRGSPPPHRASG 
DLPHGLAGAQLHHIGLQG 
ISHIASRVPRFTTSASSV 

CTA GCT CAC CTA CCG GCT CGC GTG GCC GGA CTT CCA CCA CCT ACG GCT CGA CTG 
14481 14490 14499 14508 14517 14526 

GAT CGA GTG GAT GGC CGA GCG CAC CGG CCT GAA GGT GGT GGA TGC CGA GCT GAC 

DRVD GRAHRPEGGGC RAD 
IEWMAERTGLKVVDAELT 
SSGWPSAPA*RWWMPS*P 

RRRR F GRARAP GGR S R E G 
GDVA SAEREHQGAAA GRA 
GT*PPLRESTSARRPEER 

GGG GCA GAT GCC GCC TTC GGA GAG CGA GCA CGA CCG GGC GGC GCC GAG GAG AGC 
14535 14544 14553 14562 14571 14580 

CCC CGT CTA CGG CGG AAG CCT CTC GCT CGT GCT GGC CCG CCG CGG CTC CTC TCG 

PRLRRKPLARAGPPRLLS 
PVYGGSLSLVLARRGSSR 
PSTAEASRSCWPAAAPLA 

P*RAP APGCGRRL SPGAR 
LDVLRRQGADAGSLRVQG 
WTLSGASARMRAPSVSRG 



GGT CCA GTT GCT CGG CCG CGA CCG GGC GTA GGC GCG GCC TCT CTG CCT GGA CGG 
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14589 14598 14607 14616 14625 14634 

CCA GGT CAA CGA GCC GGC GCT GGC CCG CAT CCG CGC CGG AGA GAC GGA CCT GCC 

PGQRAGAGPHPRRRDGPA 
QVNEPALARIRAGETDLP 
RSTSRRWPASAPERRTC 

RPTRGASRPTGHGVGPI 
VRLEGPPGLLGTVSEQFE 
*ASNARRVSSDRSRSRSN 

GAT GCG CCT CAA GCG GGC CGC CTG GCT CCT CAG GGC ACT GGC TGA GGA CCT TAA 
14643 14652 14661 14670 14679 14688 

CTA CGC GGA GTT CGC CCG GCG GAC CGA GGA GTC CCG TGA CCG ACT CCT GGA ATT 

LRGVRPADRGVP*PTPGI 
YAEFARRTEESRDRL LE F 
TRSSPGGPRSPVTDS WNS 

* R R A P CPAACGQ SRR RS S 
EGGRPVLPQVGKAVA GRR 
RVAERSLPSCVRP*PAEV 

GGA GTG GCG GAG CGC CCT GTT CCC CGA CGT GTG GGA ACC GAT GCC GCG GAG CTG 
14697 14706 14715 14724 14733 14742 

CCT CAC CGC CTC GCG GGA CAA GGG GCT GCA CAC CCT TGG CTA CGG CGC CTC GAC 

PHRLAGQGAAHPWLRR LD 
LTASRDKGLHTLGYGAST 
SPPRGTRGCTPLATA PRR 

PCR*GATSRGPRSAGARC 
LAVDDQ LVAAQVLRE QGA 
FPLTMRCYQPRSSVSRGQ 

CTT CCC GTT GCA GTA GGA CGT CAT GAC GCC GGA CCT GCT CTG CGA GGA CGG GAC 
14751 14760 14769 14778 14787 14796 

GAA GGG CAA CGT CAT CCT GCA GTA CTG CGG CCT GGA CGA GAC GCT CCT GCC CTG 

EGQRHPAVLRPGRDAP AL 
KGNVI LQYCGLDETLLPC 
RATSSCSTAAWTRRS CPA 

RRPSRPCTRSSCARCSCG 
DGLHVLVLEAAVRGARVD 
MASTFS SLNPQ*VGPVFM 

GTA GCG GCT CCA CTT GCT CCT GTT CAA GCC GAC GAT GTG CGG GCC GTG CTT GTA 
14805 14814 14823 14832 14841 14850 

CAT CGC CGA GGT GAA CGA GGA CAA GTT CGG CTG CTA CAC GCC CGG CAC GAA CAT 

HRRGE RGQVRLLHARH EH 
IAEVNEDKFGCYTPGTNI 
SPR*TRTSSAATRPART S 

S R »JR RPPPGPAQARGTGPG 
RDDGLLLGPRKLGVLEQD 
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GGG CTA GCA GAG GCT CCT CCT CCG GGC CCG CGA ACT CGG GCT GGT CAA GGA CCA 
14859 14868 14877 14886 14895 14904 

CCC GAT CGT CTC CGA GGA GGA GGC CCG GGC GCT TGA GCC CGA CCA GTT CCT GGT 

PDRLRGGGPGA*ARPVP G 
PIVSEEEARALEPDQFLV 
RSSPRRRPGRLSPTSSWS 

GTSRGPRSPRGPVRSGPR 
ERPDVPVRHDGPFAVEQG 
RGHI*RSAITARSRSKRA 

GGA GGG CAC CTA GAT GGC CCT GCG CTA CCA GCG GGC CCT TGC GCT GAA GGA CCG 
14913 14922 14931 14940 14949 14958 

CCT CCC GTG GAT CTA CCG GGA CGC GAT GGT CGC CCG GGA ACG CGA CTT CCT GGC 

PPVDLPGRDGRPGTRLPG 
LPWIYRDAMVARERDFLA 
SRGSTGTRWSPGNATSWP 

RLCGPREAAWAPLQTI PH 
GSAAQDKRQGRQFNHSRT 
EPPLRTKGSGVS'STTHDP 

GAG GCC TCC GTC GGA CCA GAA AGG CGA CGG GTG CGA CCT TCA ACA CAC TAG CCC 
14967 14976 14985 14994 15003 15012 

CTC CGG AGG CAG CCT GGT CTT TCC GCT GCC CAC GCT GGA AGT TGT GTG ATC GGG 

LRRQPGL SAAHAGSCVI G 
SGGSLVFPLPTLEVV* SG 
PEAAWS FRCPRWKLCDR (v) 



RLHCRAAGGAHKGHAQQR 
ASTVDRPVVRTSATHRSD 
PPPSMARCWGRAQRT GAT 

ACC GCC TCC ACT GTA GCG CGC CGT GGT GGG CGC ACG AAC GGC ACA CGG ACG ACA 
15021 15030 15039 15048 15057 15066 

TGG CGG AGG TGA CAT CGC GCG GCA CCA CCC GCG TGC TTG CCG TGT GCC TGC TGT 

WRR*HRAAPPACLPCACC 
GGGD IARHHPRACRVPAV 
AEVTSRGTTRVLAVCLL S 

HQRQQGRGQQQPVAGRAL 
TSGSSAAARSSHCPVVPL 
PAAAAP R PGAATARC WP C 

GCC ACG ACG GCG ACG ACC GGC GCC GGG ACG ACG ACA CCG TGC CGT GGT GCC CGT 
15075 15084 15093 15102 15111 15120 

CGG TGC TGC CGC TGC TGG CCG CGG CCC TGC TGC TGT GGC ACG GCA CCA CGG GCA 

RCCRCWPRPCCCGTAPRA 
G A >& A A G R GPAAVARHH GQ 
VLPLLAAALLLWHGTTGK 
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vvrrsgagptgrrpi rrm 
ssadrgp eplavgpsagc 

PRRTAVR SRSHWAPPHAA 

TCC TGC TGC GCA GCG CTG GGC CGA GGC CCT CAC GGT GCG GCC CCC TAC GCG GCG 
15129 15138 15147 15156 15165 15174 

AGG ACG ACG CGT CGC GAC CCG GCT CCG GGA GTG CCA CGC CGG GGG ATG CGC CGC 

RTTRRD PAPGVPRRGMRR 
GRRVATRLRECHAGGCAA 
DDASRPGSGSATPGDAP H 

DLRPPQQEGEGHHHGDRP 
TSAHRNS SARATTTATAR 
HRPTATAARGRRP PPRRA 

TAC AGC TCC GCA CCG CCA ACG ACG AGC GGG AGC GGC ACC ACC ACC GGC AGC GCG 
15183 15192 15201 15210 15219 15228 

ATG TCG AGG CGT GGC GGT TGC TGC TCG CCC TCG CCG TGG TGG TGG CCG TCG CGC 

MSRRGGCCSPSPWWWP SR 
CRGVAVAARPRRG GGRRA 
VEAWRL L LALAVVVAVAR 

GASRQDAPVQALWAHHAL 
AQPASTPRCKPWGRTTP S 
PRRLAPRGASPGAVRPPR 

CCC GGA CGC CTC GCG ACC AGC CGG CCG TGA ACC CGG TCG GTG CGC ACC ACC CGC 
15237 15246 15255 15264 15273 15282 

GGG CCT GCG GAG CGC TGG TCG GCC GGC ACT TGG GCC AGC CAC GCG TGG TGG GCG 

GPAERWSAGTWASHAWWA 
GLRSAGRPALGPATRGGR 
ACGALVGRHLGQPRVVGE 

HDGPDNEARRHEAEDSGP 
I IEPIT RPGETSPRTA GP 
SSRRSRERGKPARGRRER 

TCT ACT AGA GGC CCT AGC AAG AGC CGG GAA GCC ACG AGC CGG AGC AGC GAG GGC 
15291 15300 15309 15318 15327 15336 

AGA TGA TCT CCG GGA TCG TTC TCG GCC CTT CGG TGC TCG GCC TCG TCG CTC CCG 

R*SPGSFSALRCSASSLP 
DDLRDR SRPFGARPRRSR 
MISGIVLGPSVLGLVAPG 

DVVGE E GGGE'VGVE I E D G 
TWSARKGAARWE * R S R T A 
PGRRGR GRRGGSRGRDRR 

CCC AGG TGC TGC GGG AGA AGG GGC GGC GGG AGG TGA GGA TGG AGC TAG AGC AGC 
15345 15354 15363 15372 15381 15390 

GGG TCC AGG ACG CCC TCT TCC CCG CCG CCC TCC ACT CCT ACC TCG ATC TCG TCG 
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GPRRPLPRRPPLLPRSRR 
VHDALFPAALHSYLDLV 

LDPQRQE HEQDAHLE TV 
WIPSASNMNRIPMSNPSV 
GSRAPAT *TGSRCPTRHC 

GGG TCT AGC CCG ACC GCG ACA AGT ACA AGG ACT AGC CGT ACC TCA AGC CAC TGT 
15399 15408 15417 15426 15435 15444 

CCC AGA TCG GGC TGG CGC TGT TCA TGT TCC TGA TCG GCA TGG AGT TCG GTG ACA 

PRSGWRCSCS*SAWSSVT 
PDRAGAVHVPDRHGVR * H 
Q I GLAL FMFL I GME F GD T 

VMFARAAGPGGHSDDADA 
WWSPAPRVPAATPITPTQ 
GGHLRP GCRPRRP FRRRR 

GGG TGG TAC TTC CGC GCC CGG CGT GGC CCC GGC GGC ACC CTT AGC AGC CGC AGA 
15453 15462 15471 15480 15489 15498 

CCC ACC ATG AAG GCG CGG GCC GCA CCG GGG CCG CCG TGG GAA TCG TCG GCG TCT 

PTMKARAAPGPPWESSAS 
PP*RRGPHRGRRGNRRR L 

HHEGAGRTGAAVGIVGVC 

HREGEATSQSVRQVGAVG 
TDNARPQARPYA SYV P * A 

RTTRGRSHEPIRATCRSR 

CGC ACA GCA AGC GGG AGC CGA CAC GAG ACC CTA TGC GCG ACA TGT GGC CGA TGC 
15507 15516 15525 15534 15543 15552 

GCG TGT CGT TCG CCC TCG GCT GTG CTC TGG GAT ACG CGC TGT ACA CCG GCT ACG 

ACRSPSAVLWDTRCTPAT 
RVV RPRLCSGIRAVHRLR 
VSFALGCALGYALYTGYA 

RVADAEQREGEEQADGHA 
GSPTPK RGNVRKRPMAML 
GPRRRS GAT*GRGPCRWS 

GGG GCC TGC CGC AGC CGA AGG ACG GCA AGT GGG AGA AGG ACC CGT AGC GGT ACT 
15561 15570 15579 15588 15597 15606 

CCC CGG ACG GCG TCG GCT TCC TGC CGT TCA CCC TCT TCC TGG GCA TCG CCA TGA 

P RTASASCRSPSSWAS P * 
PGRRRLPAVHPLPGHRHE 
PDGVGFLPFTLFLGIAMS 

HGGEGHQRPQQHFAPHEL 
TVAKGTSARSSISRPI SW 

RSRRGRAPAAASPVRSAG 



CGC ACT GGC GGA AGG GGC ACG ACC GCG CCG ACG ACT ACC TTG CGC CCT ACG AGG 
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15615 15624 15633 15642 15651 15660 

GCG TGA CCG CCT TCC CCG TGC TGG CGC GGC TGC TGA TGG AAC GCG GGA TGC TCC 



A*PPSPCWRGC*WNAGCS 
RDRLPRAGAAADGTRDAP 
VTAFPVLARLLMERGMLQ 

GPRAGVGDHPGGGG I EGA 
DRAPV*AMTPAAVASRAQ 
TGPPCRRWRPPRWRRDRR 

TCA GGG CCC GCC CGT GGA TGC GGT AGC ACC CCC GGC GGT GGC GGC TAG AGC GGA 
15669 15678 15687 15696 15705 15714 

AGT CCC GGG CGG GCA CCT ACG CCA TCG TGG GGG CCG CCA CCG CCG ATC TCG CCT 

SPGRAPTPSWGPPPPI SP 
VPGGHLRHRGGRHRRSRL 
SRAGTYAIVGAATADLAC 

PQQERTEDGQQAATRGQA 
QSSSAPRTARNRPPEGRP 
SAAARPDRRGTARRNAGP 

CGA CCG ACG ACG AGC GCC CAG AGC AGC GGG ACA ACG CGC CGC CAA GCG GGG ACC 
15723 15732 15741 15750 15759 15768 

GCT GGC TGC TGC TCG CGG GTC TCG TCG CCC TGT TGC GCG GCG GTT CGC CCC TGG 

AGCCSRVSSPCCAAVRPW 
LAAARGSRRPVARRFAPG 
WLLLAGLVALLRGGSPLG 

HQAGEREGRDEEADHHHE 
TSRVRASVATKKPTMT T S 
RAACGRA*RPRRRR* p PA 

CGC ACG ACG CGT GGG AGC GCG AGT GGC GCC AGA AGA AGC CGC AGT ACC ACC ACG 
15777 15786 15795 15804 15813 15822 

GCG TGC TGC GCA CCC TCG CGC TCA CCG CGG TCT TCT TCG GCG TCA TGG TGG TGC 

ACCAPSRSPR SSSASWWC 
RAAHPRAHRGLLRRHGGA 
VLRTLALTAVFFGVMVVL 

DAGGQSADQLPRLAPQGV 
TRGAKRRTRSRGSRRSGS 
RGGRRAVRGPAAPAGAAR 

AGC AGG CGG GGC GGA ACG CTG CGC AGG ACC TCG CCG GCC TCG CGG CCG ACG GGC 
15831 15840 15849 15858 15867 1587-6 

TCG TCC GCC CCG CCT TGC GAC GCG TCC TGG AGC GGC CGG AGC GCC GGC TGC CCG 

SSAPPCDASWSGRSAGCP 
RPPRLATRPGAAGAPAAR 
VRPALRRVLERPERRLPD 

A A _H ECQDDGADQQGRDGG 
PPTSVSIMGPTRSDATAV 
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TGC CGC CGC ACG AGT GTG ACT AGT AGG GGC CGC AGG ACG ACA GGC GCC AGC GGT 
15885 15894 15903 15912 15921 15930 

ACG GCG GCG TGC TCA CAC TGA TCA TCC CCG GCG TCC TGC TGT CCG CGG TCG CCA 

TAACSH*SSPASCCPRSP 
RRRAHTDHPRRPAVRGRH 
GGVLTLI IPGVLLSAVAT 

LEYADMEDEAGEQEAGDA 
SSMPMWRMKPAKRNPAMQ 
RA*LCGD*RRRRGTRRWR 

GGC TCG AGT ATC CGT AGG TAG AGT AGA AGC CGC GGA AGG ACA AGC CGC GGT AGA 
15939 15948 15957 15966 15975 15984 

CCG AGC TCA TAG GCA TCC ATC TCA TCT TCG GCG CCT TCC TGT TCG GCG CCA TCT 

PSS*ASISSSAPSCSAPS 
RAHRHPSHLRRLPVRRHL 
ELIGIHLIFGAFLFGAI C 

RLGRRGQRVGAAF Q L F E D 
GFVAGARASARPL SC S S T 
GSSRAPGPPRGRCVAPVR 

CGG GCT TCT GGC GCG GCC GGG ACC GCC TGC GGG CGC CGT TTG ACG TCC TTG AGC 
15993 16002 16011 16020 16029 16038 

GCC CGA AGA CCG CGC CGG CCC TGG CGG ACG CCC GCG GCA AAC TGC AGG AAC TCG 

ARRPRRPWRTPAANCRN S 
PEDRAGPGGRPRQTAGTR 
PKTAPALADARGKLQE L V 

GGYQQRREEGRDAQLGVQ 
VATSNGGNKAETPRFVSR 
*RRVTAATRRRPRGSSRG 

AGT GGC GGC ATG ACA ACG GCG GCA AGA AGC GGA GCC AGC CGG ACT TCT GGC TGG 
16047 16056 16065 16074 16083 16092 

TCA CCG CCG TAC TGT TGC CGC CGT TCT TCG CCT CGG TCG GCC TGA AGA CCG ACC 

SPPYCCRRSSPRSA*RPT 
HRRTVAAVLRLGRPEDRP 
TAVLLPPFFASVGLKTDL 

QLEAPAAAGQPHPGADGQ 
SCSPRPPPARHTHAPTAR 
AAVRGPRRRGTPTPRRRG 

ACG ACG TTG AGC CGG CCC CGC CGC CGC GGG ACA CCC ACA CCC GGC CGC AGC GGG 
16101 161 10 16119 16128 16137 16146 

TGC TGC AAC TCG GCC GGG GCG GCG GCG CCC TGT GGG TGT GGG CCG GCG TCG CCC 

CCNSAGAAAPCGCGPASP 
AA^RPGRRRPVGVGRRRp 

LQLGRGGGALWVWAGVAL 
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QHGDDAFQRAARRCRRQH 
STATTPLSAPLAAAAAS I 
APPRRRCVPPCRPPLPAS 

ACG ACC ACC GGC AGC AGC CGT TTG ACC GCC CGT CGC GCC GCC GTC GCC GCG ACT 
16155 16164 16173 16182 16191 16200 

TGC TGG TGG CCG TCG TCG GCA AAC TGG CGG GCA GCG CGG CGG CAG CGG CGC TGA 

CWWPS SANWRAARRQRR * 
AGGRRRQTGGQRGGS GAD 
LVAVVGKLAGSAAAAALM 

RHLADVGQADAHEHVAAS 
DTSRTSARRMPT SMFQRP 
TPPARRRGACRRA* S SGR 

ACA GCC ACC TCG CGC AGC TGC GGG ACG CGT AGC CGC ACG AGT ACT TGA CGG CGC 
16209 16218 16227 16236 16245 16254 

TGT CGG TGG AGC GCG TCG ACG CCC TGC GCA TCG GCG TGC TCA TGA ACT GCC GCG 

CRWSASTPCASACS*TAA 
VGGARRRPAHRRAHE L PR 
SVERVDALRIGVLMNCRG 

QGFQHDEGDPEFEADQCG 
SVSSTIRVMPSSSPTRV G 
VSRVPSG*WRARVRRGSV 

CTG ACT GGC TTG ACC ACT AGG AGT GGT AGC CCG AGC TTG AGC CGC AGG ACT GTG 
16263 16272 16281 16290 16299 16308 

GAC TGA CCG AAC TGG TGA TCC TCA CCA TCG GGC TCG AAC TCG GCG TCC TGA CAC 

D*PNW*SSPSGSNSAS*H 
TDRTGDPHHRARTRRPD T 
LTELVI LTIGLELGVL. TP 

RQEGHQDDDGQAGGDHGR 
ANNVMSTMTVRHAVTMVA 
RTT*WAP*R*GTRWR*SR 

GGC GCA ACA AGT GGT ACG ACC AGT AGC AGT GGG ACA CGC GGT GGC AGT ACT GGC 
16317 16326 16335 16344 16353 16362 

CCG CGT TGT TCA CCA TGC TGG TCA TCG TCA CCC TGT GCG CCA CCG TCA TGA CCG 

PRCSPCWSSSPCAPP S*P 
RVVHHAGHRHPVRHRHDR 
ALFTMLVIVTLCATVMTA 

RQEVQE VAGLRAGRGGT C 
GS SSRS SRASARVAGARV 
AAARGAR GRRPACRARGY 

GCG GCG ACG AGC TGG ACG AGC TGG CGC GGC TCC GCG CGT GGC GCG GGC GGG CAT 
16371 16380 16389 16398 16407 16416 

CGC CGC TQC TCG ACC TGC TCG ACC GCG CCG AGG CGC GCA CCG CGC CCG CCC GTA 
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AAARPARPRRGAHRARPY 
PLLDLLDRAEARTAPART 

FRTGDNASSPAAFEARS I 
FALETTRQRRHPSNQGP F 
LLSNRRE SVVTRRIRGP F 

GTT TTC GCT CAA GGC AGC AAG CGA CTG CTG CCA CGC CGC TTA AGA CGG GCC CTT 
16425 16434 16443 16452 16461 16470 

CAA AAG CGA GTT CCG TCG TTC GCT GAC GAC GGT GCG GCG AAT TCT GCC CGG GAA 

QKRVPSFADDGAANSARE 
KSEFRRSLTTVRRILPGK 
KASSVVR*RRCGEFCPGN 

GSRT*TIGELIGVFRQSH 
APAPRPSERLFVSLVSV I 
HRLPDLHNG*SYRCFAS * 

TAC GGC CTC GCC CAG ATC CAC TAA GGG AGT TCT TAT GGC TGT TTT GCG ACT GAT 
16479 16488 16497 16506 16515 16524 

ATG CCG GAG CGG GTC TAG GTG ATT CCC TCA AGA ATA CCG ACA AAA CGC TGA CTA 

MPERV*VIPSRIPTKR*L 
CRSGSR*FPQEYRQNADY 
AGAGLGD SLKNTDKTLTM 

DDFSHLDTRAPDLLGSFL 
ITLLICI RARRTWYAQFC 
S R * F F A S GHAGPGTLRFV 

ACT AGC AGT TTT CTT ACG TCT AGG CAC GCG CGG CCC AGG TCA TTC GGA CTT TTG 
16533 16542 16551 16560 16569 16578 

TGA TCG TCA AAA GAA TGC AGA TCC GTG CGC GCC GGG TCC AGT AAG CCT GAA AAC 

*SSKECRSVRAGSSKPEN 
DRQKNADPCAPGPVSLK T 
IVKRMQ I RARRVQ*A* KQ 

STPQHLYGVQVDTSEADE 
PPPNTCIASRYMPARPTK 
PLHTPAS LRGTCRHERRR 

TCC CTC CAC CCA ACC ACG TCT ATC GGC TGG ACA TGT AGC CAC GAG AGC CGC AGA 
16587 16596 16605 16614 16623 16632 

AGG GAG GTG GGT TGG TGC AGA TAG CCG ACC TGT ACA TCG GTG CTC TCG GCG TCT 

REVGWCR*PTCTSVLSAS 
G R W V G^ ADSRPVHRCSRRL 
G G G L (V j QIADLYIGALGVF 

— Z> 

YRRTHADFPGHFAAE I RG 
TGGHTLT SHATSRPR * GA 
RVATHSRRIPRPVRGRDP 



AGC ATG GCG GCA CAC ACT CGC AGC TTA CCC GGC ACC TTG CGC CGG AGA TAG GCC 
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16641 1 6650 1 6659* 16668 1 6677 * 1 6686 

TCG TAC CGC CGT GTG TGA GCG TCG AAT GGG CCG TGG AAC GCG GCC TCT ATC CGG 



SYRRV*ASNGPWNAAS I R 
RTAVCERRMGRGTRPLS G 
VPPCVSVEWAVERGLYPA 

FLGLCVLEAPDGYGAVDG 
SSASACSSPPTAMAPSTG 
RLPRPVRARRPRWLRRR Q 

GGC TTC TCC GGC TCC GTG TGC TCG AGC CGC CCC AGC GGT ATC GGC CGC TGC AGG 
16695 16704 16713 16722 16731 16740 

CCG AAG AGG CCG AGG CAC ACG AGC TCG GCG GGG TCG CCA TAG CCG GCG ACG TCC 

PKRPRHTSSAGSP*PAT S 
RRGRGTRARRGRHSRRRp 
EEAEAHELGGVAIAGDVP 

RRFHGQPRRLLRHLPPAS 
GG SI AKR AAC CAT F LHP P 
GE PFPRAPP AAPPSS TPR 

GGG GAG GCC TTT ACC GGA ACG CCC GCC GCG TCG TCC GCC ACT TCT CCA CCC CGC 
16749 16758 16767 16776 16785 16794 

CCC CTC CGG AAA TGG CCT TGC GGG CGG CGC AGC AGG CGG TGA AGA GGT GGG GCG 

PLRKWPCGRRSRR*RGGA 
PSGNGLAGGAAGGEEVGR 
PPEMALRAAQQAVKRWGG 

RRRFE IQQQIRAGPVLAR 
DGVSNSRSSYALVQCWPG 
IASPIRDAATHSCRAGPG 

CTA GCG GCT GCC TTA AGC TAG ACG ACG ACA TAC GCT CGT GGA CCG TGG TCC CGG 
16803 16812 16821 16830 16839 16848 

GAT CGC CGA CGG AAT TCG ATC TGC TGC TGT ATG CGA GCA CCT GGC ACC AGG GCC 

DRRRNS I CCCMRAPGTRA 
IADGIRSAAVCEHLAPGP 
SPTEFDLLLYASTWHQGP 

VAPRGLCVQLPVQHAPVH 
SPQGGWAYRCRCRTPPSM 
PR SAAGPMGAAAGPPRPC 

GCC TGC CGA CCG GCG GGG TCC GTA TGG ACG TCG CCG TGG ACC ACC CGC CCC TGT 
16857 16866 16875 16884 16893 16902 

CGG ACG GCT GGC CGC CCC AGG CAT ACC TGC AGC GGC ACC TGG TGG GCG GGG ACA 

RTAGRPRHTCSGTWWAGT 
GRLAAPGIPAAAPGGRGH 
DGWPPQAYLQRHLVGGDM 

E G * W Q LDPLAAVAHEARQFE 
SARSILCPQLPTNLASSS 
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ACG AGC GGG ACC TCT AGT CCG TCC CGA CGT TGC CGC ACA AGT CGC GCG ACC TTG 
16911 16920 16929 16938 16947 16956 

TGC TCG CCC TGG AGA TCA GGC AGG GCT GCA ACG GCG TGT TCA GCG CGC TGG AAC 

CSPWR-S6RAATACSARWN 
ARPGDQAGLQRRVQRAGT 
LALE IRQGCNGVFSALEL 

GDAVQLGIRVAGARQDDG 
ATP*RCASGFRVLAS ITA 
RRRSGAPRDSGCWRA SR R 

AGC GGC AGC CGA TGG ACG TCC GGC TAG GCT TGG CGT GGT CGC GCG ACT AGC AGC 
16965 16974 16983 16992 17001 17010 

TCG CCG TCG GCT ACC TGC AGG CCG ATC CGA ACC GCA CCA GCG CGC TGA TCG TCG 

SPSATCRPIRTAPAR *S S 
RRRLPAGRSEPHQRADRR 
AVGYLQADPNRTSAL IVA 

GVVVSRRQDVPPPHAGAE 
ASL*PVGSISRHRIPGPK 
RRCSRFAASRGTASPGRS 

GGC GGC TGT TGA TGC CTT GCG GCG ACT AGC TGG CCA CCG CCT ACC CGG GGC CGA 
17019 17028 17037 17046 17055 17064 

CCG CCG ACA ACT ACG GAA CGC CGC TGA TCG ACC GGT GGC GGA TGG GCC CCG GCT 

PPTTT ERR* STGGGW APA 
RRQLRNAADRPVADGPRL 
ADNYGTPL IDRWRMGP G F 

DAA I RERGPAALPGAEGP 
MPPSASGGQHQLRGPKAR 
*RRRHAGARTSCAAR SRG 

AGT AGC CGC CGC TAC GCG AGG GCG GGA CCA CGA CGT TCG CCG GGC CGA AGC GGG 
17073 17082 17091 17100 17109 17118 

TCA TCG GCG GCG ATG CGC TCC CGC CCT GGT GCT GCA AGC GGC CCG GCT TCG CCC 

SSAAMRSRPGAASGPASP 
HRRRCAPALVLQAAR LRP 
IGGDALPPWCCKRPGFAR 

EARHGGLPQRLDLRQVAT 
SQETAELPSGSISDSC RP 
ARSP'PRWPAAPSRTAA. GR 

CCG AGA CGA GCC ACC GGA GGT TCC CCG ACG GCC TCT AGC TCA GCG ACG TGG CGC 
17127 17136 17145 17154 17163 17172 

GGC TCT GCT CGG TGG CCT CCA AGG GGC TGC CGG AGA TCG AGT CGC TGC ACC GCG 

GSARWPPR GCRRS SRCTA 
A L ,.L G G L Q G AA G D R V A A P R 
LCSVASKGLPEI ESLHRG 
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VLRQERRADGPATGGVEA 
SSGNNGGLMVRPRAVSKL 
HRATTGASC*GPGHWRS * 

CAC TGC TCG GCA ACA AGG GCG GCT CGT AGT GGG CCC CGG CAC GGT GGC TGA AGT 
17181 17190 17199 17208 17217 17226 

GTG ACG AGC CGT TGT TCC CGC CGA GCA TCA CCC GGG GCC GTG CCA CCG ACT TCA 

VTSRCSRRASPGAVPPT S 
*RA VVPAEHHPGPCHRLQ 
DEPLFPPSITRGRATDFS 

GTDALLEGGAAGGENRHG 
ARIPWCNAVRLGAKTA I A 
RGYRGATRWGCGRRRQ S P 

CGC GGG CAT AGC CGG TCG TCA AGC GGT GGG CGT CGG GGC GGA AGC AAC GCT ACC 
17235 17244 17253 17262 17271 17280 

GCG CCC GTA TCG GCC AGC AGT TCG CCA CCC GCA GCC CCG CCT TCG TTG CGA TGG 

APVS A S S S PPAAP P S L R W 
RPYRPAVRHPQPRLRCDG 
ARI GQQFATRSPAFVAMA 

LNLVMHHVHGLAGQGPGA 
S I * SWI I ST-ASRARAPAP 
RSEPGY SPRPRARGPRPR 

GGC TCT AAG TCC TGG TAT ACT ACC TGC ACC GGC TCG CGC GGG ACC GGC CCC GGC 
17289 17298 17307 17316 17325 17334 

CCG AGA TTC AGG ACC ATA TGA TGG ACG TGG CCG AGC GCG CCC TGG CCG GGG CCG 

PRFRTI *WTWPSAPWPGP 
RDSGPYDGRGRARPGRGR 
EIQDHMMDVAERALAGAG 

DPHRVD GADGEHV .I VR L P 
MPIASTARTEKMF* * A F H 
CRSPPRRGRRR* S SDR ST 

CGT AGC CCT ACC GCC TGC AGC GGG CGC AGA GGA AGT ACT TGA TAG TGC GCT TCA 
17343 17352 17361 17370 17379 17388 

GCA TCG GGA TGG CGG ACG TCG CCC GCG TCT CCT TCA TGA ACT ATC ACG CGA AGT 

ASGWRTSPASPS*TITRS 
HRDGGRRPRLLHELSREV 
IGMADVARVSFMNYHAKW 

RATS FPPRPPAATGTWTP 
DLLASHRGPPHRQGPGRP 
TSCHQIAAQPTGSDRDVH 

CCA GCT CGT CAC GAC TTA CCG CCG GAC CCC CCA CGG CGA CAG GGC CAG GTG CAC 
17397 17406 17415 17424 17433 17442 

GGT CGA GCA GTG CTG AAT GGC GGC CTG GGG GGT GCC GCT GTC CCG GTC CAC GTG 



-68 - 



G R A V L N G G L G G A A V P V H V 
VEQC*MAAWGVPLSRSTW 
S S SAE W R P GGCR C P G P R G 



IRGPSRGSAPGAVMQQGH 
FEAPLDAVQPALSWRS DM 
SNPRSI PWKRPWRGDATW 



CCT TAA GCC GGC CCT CTA GCC GGT GAA CGC CCC GGT CGC TGG TAG ACG ACA GGT 
17451 17460 17469 17478 17487 17496 

GGA ATT CGG CCG GGA GAT CGG CCA CTT GCG GGG CCA GCG ACC ATC TGC TGT CCA 



GIRPGDRPLAGPATI CCP 
EFGRE I GHLRGQRPSAVH 
NSAGRSATCGASDHLL SM 



FVDYPGTLEGGAVVDQLE 
SCMTR-VPSSAGPSWTRC S 
PVCRVSRHARGRRGRGAV 

ACC TTG TGT AGC ATG CCT GGC CAC TCG AGC GGG GGC CGC TGG TGC AGG ACG TTG 
17505 17514 17523 17532 17541 17550 

TGG AAC ACA TCG TAC GGA CCG GTG AGC TCG CCC CCG GCG ACC ACG TCC TGC AAC 

WNTSYGPVSSPPATTSCN 
GTHRTDR *ARPRRPRPAT 
-EHIVRTGELAPGDHVLQL 

GRGRAQHHGAGDKLNE FR 
AVAGPR T TDLATR * T R S D 
RWPGPGPPTWRRGEPER I 

AGC GGT GCC GGG GCC CGG ACC ACC ACA GGT CGC GGC AGG AAG TCC AAG AGC TTA 
17559 17568 17577 17586 17595 17604 

TCG CCA CGG CCC CGG GCC TGG TGG TGT CCA GCG CCG TCC TTC AGG TTC TCG AAT 



SPRPRAWWCPAPSFRFSN 
RHGPGPGGVQRRP SGSR I 
ATAPGLVVSSAVLQVLE S 

RVPVFSSYRCRRVSYARS 
GSQSSHHIGAVVFP I HGH 
APSPRI IFVPLSSRFIGT 

GCG GCC TGA CCC TGC TTA CTA CTT ATG GCC GTT GCT GCT TGC CTT ATA CGG GCA 
17613 17622 17631 17640 17649 17658 

CGC CGG ACT GGG ACG AAT GAT GAA TAC CGG CAA CGA CGA ACG GAA TAT GCC CGT 

R R T G T N_ DEYRQRRTEYAR 
A G L G R (My MNTGNDERNMPV 
P D W D E * * ^1 PATTNGI CP * 

I GQDGPPSGREPPRPRSR 
YGKIARRVGERRHGHDPD 
IDRSRGASEREGTATTP I 



CTA TAG GGA ACT AGC GGG CCG CCT GAG GGA GAG AGG CCA CCG GCA CCA GCC CTA 
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17 667 1 7676 1 T€BS 17694 1 7703 17712 

GAT ATC CCT TGA TCG CCC GGC GGA CTC CCT CTC TCC GGT GGC CGT GGT CGG GAT 

DIP*SPGGLPLSGGRGRD 
ISLDRPADSLSPVAVVGI 
YPLIARRTPSLRWPWSG 

I GTGRHH*SARRIRPGT 
SAPEGTTDVRGAFEPVQQ 
PHRNGPPTLEGPSNQSRN 

GCC TAC GGC CAA GGG GCC ACC ACA GTT GAG CGG GCC GCT TAA GAC CCT GGA CAA 
17721 17730 17739 17748 17757 17766 

CGG ATG CCG GTT CCC CGG TGG TGT CAA CTC GCC CGG CGA ATT CTG GGA CCT GTT 

RMPVPRWCQLARRILGPV 
GCRFPGGVNSPGEFWDLL 
DAGSPVVSTRPANSGTC* 

P RV C C RRR S AGR G S P L T G 
RGSAVGDALHGGVAPFLV 
VAPRLVTPSIGGSRQSSY 

CTG CCG GCC TGC GTT GTG GCA GCC GCT CTA CGG GGG GCT GGC GAC CCT TCT CAT 
17775 17784 17793 17802 17811 17820 

GAC GGC CGG ACG CAA CAC CGT CGG CGA GAT GCC CCC CGA CCG CTG GGA AGA GTA 

DGRTQHRRRDAPRPLGRV 
TAGRN.TVGEMPPDRWEEY 
RPDATPSARCPPTAGKST 

PSRDATRHPAASPSE SRC 
PVETRPE IRRQPRRN AGA 
RSKPGRNSAASRVAIREP 

GGC CCT GAA GCC AGG CGC CAA GCT ACG CCG CGA CGC CTG CCG CTA AGC GAG GCC 
17829 17838 17847 17856 17865 17874 

CCG GGA CTT CGG TCC GCG GTT CGA TGC GGC GCT GCG GAC GGC GAT TCG CTC CGG 

PGLR SAVRCGAADGD S LR 
RDFGPRFDAALRTAIRS G 
GTSVRGSMRRCGRRFAPA 

NGPRRCLPNRRRTRRCRA 
TEQVVVYRTEVGLEEADR 
LKRS SSMAPKSASNKPME 

GTC AAA GGA CCT GCT GCT GTA TCG CCC AAA GCT GCG GCT CAA GAA GCC GTA GAG 
17883 17892 17901 17910 17919 17928 

CAG TTT CCT GGA CGA CGA CAT AGC GGG TTT CGA CGC CGA GTT CTT CGG CAT CTC 

QFPGRRHSGFRRRVLRHL 
SFLDDDIAGFDAEFFG I S 
VSWTTT*RVSTPSSSASR 

A R ,,.P RASPGAAAGS APPPR 
RALGLQHVRLLAQHQLHG 
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CGG CGC GCT CCG GCT CGA CTA CCT GGG CGT CGT CGC GGA CTA CGA CCT CCA CCG 
17937 17946 17955 17964 17973 17982 

GCC GCG CGA GGC CGA GCT GAT GGA CCC GCA GCA GCG CCT GAT GCT GGA GGT GGC 

AARGRADGPAAAPDAGGG 
PREAELMDPQQRLMLEVA 
RARPS*WTRSSA*CWRWP 

APVPARPCGAACGPL SRC 
PLCQLVRADRRVGQCPGV 
QCAS SCAPMGGCVRAPVS 

GAC CGT CCG TGA CCT CGT GCG CCC GTA GGG CGG CGT GTG GGA CCG TCC CTG GCT 
17991 18000 18009 18018 18027 18036 

CTG GCA GGC ACT GGA GCA CGC GGG CAT CCC GCC GCA CAC CCT GGC AGG GAC CGA 

LAGT GARGHPAAHPGRDR 
WQALEHAGIPPHTLAGTD 
GRHWSTRASRRTPWQGPT 

RHTRRPR CRRSHRRVAP L 
GTHEGPDAGVVIAGSPQ F 
VPTNAPTQV*S*PAPRS S 

GTG GCC ACA CAA GCG GCC CCA GAC GTG ,GAT GCT GAT ACC GCG GCC TGC CGA CCT 
18045 18054 18063 18072 18081 18090 

CAC CGG TGT GTT CGC CGG GGT CTG CAC CTA CGA CTA TGG CGC CGG ACG GCT GGA 

HRCVRRGLHLRLWRRTAG 
TGVFAGVCTYDYGAGRLE 
PVCSPGSAPTTMAPDGWK 

GASCRRMSPSRRPPTRRT 
VQRVDVCPRPDARRHAGH 
SRGFMSAHVPIPAATHAT 

TCT GGA CGG CTT GTA GCT GCG TAC CTG CCC CTA GCC GCG CCG CCA CAC GCG GCA 
18099 18108 18117 18126 18135 18144 

AGA CCT GCC GAA CAT CGA CGC ATG GAC GGG GAT CGG CGC GGC GGT GTG CGC CGT 

RPAE HRRMDGDRRGGVRR 
DLPN IDAWTGI GAAVCAV 
TCRT STHGRGSARRCAP C 

WGRRERARGARAWGRWRC 
GVADRVREVQAPGAE GDV 
DLRTE*ASSRRPGLREMS 

CAG GTT GGC GCA GAG AGT GCG CGA GCT GGA CGC GCC CGG GTC GGA GAG GTA GCT 
18153 18162 18171 18180 18189 18198 

GTC CAA CCG CGT CTC TCA CGC GCT CGA CCT GCG CGG GCC CAG CCT CTC CAT CGA 

VQPRL SRARPARAQPL HR 
S N s g V SHALDLRGPSL S I D 
PTASLTRSTCAGPASPST 
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RTSPRGPPAACRRASGAA 
GRARGGQHRQ VGGRLAQ p 
VAHEAERTASCVAACLRR 

GTG GCG CAC GAG CCG GAG GGA CCA CCG CGA CGT GTG GCG GCG CGT CTC GGA CGC 
18207 18216 18225 18234 18243 18252 

CAC CGC GTG CTC GGC CTC CCT GGT GGC GCT GCA CAC CGC CGC GCA GAG CCT GCG 

HRVLGLPGGAAHRRAEPA 
TACSAS LVALHTAAQ S L R 

PRARPPWWRCTPPRRACG 

RRTCRPAPRPR*GAPTVP 
EALAGHRQGPADVQQ H * R 

SPSHVTASAPPTLRSTD G 

CGA GCC GCT CAC GTG GCA CCG CGA CCG GCC CCC GCA GTT GGA CGA CCA CAG TGG 
18261 18270 18279 18288 18297 18306 

GCT CGG CGA GTG CAC CGT GGC GCT GGC CGG GGG CGT CAA CCT GCT GGT GTC ACC 

ARRVHRGAGRGRQPAGVT 
LGECTVAL AGGVNLLVSP 
SASAPWRWPGASTCWCHR 

GSSRGP CPRRAPARRG S C 
-ALRDGQARGA RQRGVAPA 
PWVIARPVAPASAGSPRL 

CCC GGT CTG CTA GCG GGA CCC GTG CCG GCC GCG CGA CCG CGG GCT GCC GGC CTC 
18315 18324 18333 18342 18351 18360 

GGG CCA GAC GAT CGC CCT GGG CAC GGC CGG CGC GCT GGC GCC CGA CGG CCG GAG 

GPDDRP GHGRRAGARRp E 
GQTIALGTAGALAPDGRS 
ARRSPWARPARWRPTAGA 

ATRRTPRVSRRQRTPRRS 
LREGRRGSAVGNGRRGVA 
LG NAADAPR*ATAADASP 

GTT CGG CAA GCG GCG CAG CCG GCC TGC GAT GCG GCA ACG GCG CAG CCG GCT GCC 
18369 18378 18387 18396 18405 18414 

CAA GCC GTT CGC CGC GTC GGC CGG ACG CTA CGC CGT TGC CGC GTC GGC CGA CGG 

QAVRRVGRTLRRCRVGRR 
KPFAASAGRYAVAASADG 
SRSPRRPDATPLPRRp TA 

RGRRP SRRAP* * A A S P R R 
VAAALAAAHQDDLQQRVG 
*PRPSPQPTSTMLSSVSA 

GAT GCC GGC GCC GCT CCC GAC GCC GCA CGA CCA GTA GTT CGA CGA CTG CCT GCG 
18423 18432 18441 18450 18459 18468 

CTA CGG CQQ CGG CGA GGG CTG CGG CGT GCT GGT CAT CAA GCT GCT GAC GGA CGC 
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L R P R R G L R R A G H Q A A D G R 
YGRGEGCGVLV I KLLTDA 
TAAARAAACWSS SC * R T P 

VRRHGPAPPAARCRT * GP 
YAVTVPHQRHQAAAREVL 
TRSPSRTSATSRPLANLW 

GCA TGC GCT GCC ACT GGC CCA CGA CCG CCA CGA CGC GCC GTC GCG CAA GTT GGT 
18477 18486 18495 18504 18513 18522 

CGT ACG CGA CGG TGA CCG GGT GCT GGC GGT GCT GCG CGG CAG CGC GTT CAA CCA 

RTRR*PGAGGAARQRVQP 
VRDGDRVLAVLRGSAFNQ 
YATVTGCWRCCAAARS TR 

RACWRC*PGRRAPGPAR * 
VPAGVADHGGAPLGLLVD 
SPRVLPMMAGQPCAWSCT 

CCT GCC CGC GTG GTT GCC GTA GTA CCG GGG GAC GCC CGT CCG GGT CCT CGT GCA 
18531 18540 18549 18558 18567 18576 

GGA CGG GCG CAC CAA CGG CAT CAT GGC CCC CTG CGG GCA GGC CCA GGA GCA CGT 

GRAHQRHHGPLRAGPGAR 
DGRTNGIMAPCGQAQEHV 
. T GAPTA SWPPAGRPR S T S 

SARGSPRPRRQRCRQSRR 
HPAGQRGRADSGVGNVED 
MLRARVAAPTAASVTSKT 

GTA CTC CGC GCG GGA CTG CCG GCG CCC GCA GCG ACG GCT GTG GCA ACT GAA GCA 
18585 18594 18603 18612 18621 18630 

CAT GAG GCG CGC CCT GAC GGC CGC GGG CGT CGC TGC CGA CAC CGT TGA CTT CGT 

H EARPDGRGRRCRHR* L R 
MRRALTAAGVAADTVDF V 
*GAP*RPRASLPTPLTS S 

PGRCRYGGRRGWPSRRSR 
LGVAGT GAEAVGHLDARD 
SAWPVPVRRPSGMSIPAI 

GCT CCG GGT GCC GTG GCC ATG GGC GGA GCC GCT GGG GTA CCT CTA GCC GCG CTA 
18639 18648 18657 18666 18675 18684 

CGA GGC CCA CGG CAC CGG TAC CCG CCT CGG CGA CCC CAT GGA GAT CGG CGC GAT 

RGPRHRYPPRRPHGDRRD 
EAHGTGTRLGDPME I GA I 

RPTAPVPASATPWRSARS 

RRRRVHGSRDPATRPRTP 
GGDVSTVAGTLLRARDPR 
AAT* PRSREP*SGHATPD 



GCG GCG GCA GAT GCC TGC ACT GGC GAG GCC AGT CCT CGG CAC GCG CCA GCC CAG 
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18693 18702 187TT 18720 18729 18738 

CGC CGC CGT CTA CGG ACG TGA CCG CTC CGG TCA GGA GCC GTG CGC GGT CGG GTC 

RRRLRT*PLRSGAVRGRV 
AAVYGRDRSGQEP C A V G S 

PPSTDVTAPVRSRARSG 

STWCRADPPPRRPR R p* 

HLGVDPMQLPGGPDGPDD 
TFDLMPCRSPAAPTAPTM 

CCA CTT CAG GTT GTA GCC CGT AGA CCT CCC CCG GCG GCC CCA GCG GCC CCA GTA 
18747 18756 18765 18774 18783 18792 

GGT GAA GTC CAA CAT CGG GCA TCT GGA GGG GGC CGC CGG GGT CGC CGG GGT CAT 

GEVQHRASGGGRRGRRGH 
VKSNIGHLEGAAGVAGVI 
*SPTSGIWRG PPGSPGS S 

PSGRGRRPGSGP.WGAPRR 
LRDEGEVLVPDRGAQQVA 
LAIRA RSSSRIGALRSSP 

GTT CCG CTA GGA GCG GGA GCT GCT CCT GGC CTA GGG CCG GTC GGA CGA CCT GCC 
18801 18810 18819 18828 18837 18846 

CAA GGC GAT CCT CGC CCT CGA CGA GGA CCG GAT CCC GGC CAG CCT GCT GGA CGG 

QGDPRPRRGPDPGQPAGR 
K A I LALDEDRIPASLLD G 
RRSSPSTRTGSRPACWTA 

GSGRSRSPRGRCGAPSGP 
VRVGLDVPGAEVDPQRGP 
SGFGSI SQAPRSMRSAV R 

GCT GGG CTT GGG GCT CTA GCT GAC CCG GCC GGA GCT GTA GGC CGA CCG CTG GGC 
18855 18864 18873 18882 18891 18900 

CGA CCC GAA CCC CGA GAT CGA CTG GGC CGG CCT CGA CAT CCG GCT GGC GAC CCG 

RPEPRDRLGRPRHPAGDP 
DPNPEIDWAGLDIRLATR 
TRTPRSTGPASTSGWRPG 

GATARADAGGGPPQTRN R 
GQRPGLTRVGAPRSHGTE 
ARGHGSRGCGRRAATDPK 

CCG GGA CGG CAC CGG GCT CGC AGG CGT GGG GGC GGC CCG CCG ACA CAG GCC AAA 
18909 18918 18927 18936 18945 18954 

GGC CCT GCC GTG GCC CGA GCG TCC GCA CCC CCG CCG GGC GGC TGT GTC CGG TTT 

GPAVARASAPPPGGCVRF 
ALPWPERPHPRRAAVSGF 
PCRGPSVRTPAGRLCPVS 

S R „,_R CRPGHPGRVPAWRAR 
AVAAGHGMHDEFLRGGRG 
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GCC GAT GCC GCC GTG GCA CCG GGT ACA CCA GGA GCT TGT CCG CGG GTG GCG CGG 
18963 18972 18981 18990 18999 19008 

CGG CTA CGG CGG CAC CGT GGC CCA TGT GGT CCT CGA ACA GGC GCC CAC CGC GCC 

RLRRHRGPCGPRTGAHRA 
GYGGTVAHVVLEQAPTAP 
ATAAPWPMWSSNRRPPRp 

GGRAPAPRFGTGPTRPRG 
GAGRRLRGSGQERHGRGG 
ARGAGS GAPVRNGTDAAE 

GCG GGC GGG GCG CGG CCT CGG CCG GCC TTG GGA CAA GGG CCA CAG GCG CCG GAG 
19017 19026 19035 19044 19053 19062 

CGC CCG CCC CGC GCC GGA GCC GGC CGG AAC CCT GTT CCC GGT GTC CGC GGC CTC 

RP P RAGAGRNPVP GVR GL 

ARPAPEPAGTLFPVSAAS 
PAPRRSRPEPCSRCPRPP 

P PAGHGRPRARRAPRP PR 
RLRETVARGREGLPDLLA 
GSASRSRAAASASRTS SP 

43GG CCT CCG CGA GGC ACT GGC GCG CCG GCG CGA GCG GCT CGC CCA GCT CCT CCC 
19071 19080 19089 19098 19107 19116 

CCC GGA GGC GCT CCG TGA CCG CGC GGC CGC GCT CGC CGA GCG GGT CGA GGA GGG 

PGGAP* PRGRARRAGRGG 
PEALRDRAAALAE RVE E G 
RRRSVTARPRSP SGSRRA 

QGPRPRACGPGDATGAPG 
SVQGRDP VGQGMPLGRQD 
ASRAETPCVRAWRCDGST 

GCG ACT GGA CCG GAG CCA GCC CGT GTG GGA CCG GGT AGC CGT CAG GGG CGA CCA 
19125 19134 19143 19152 19161 19170 

CGC TGA CCT GGC CTC GGT CGG GCA CAC CCT GGC CCA TCG GCA GTC CCC GCT GGT 

R*PGLGRAHPGPSAVPAG 
ADLASVGHTLAHRQSPLV 
LTWPRSGTPWPIGSPRWS 

GPPRRP SRGPRVPRRAAR 
VPRGDHRGAPVFQGGPQA 
WRAATTAVPRSS SAAP SR 

GGT GGC CCG CCG GCA GCA CCG CTG GCC GGC CCT GCT TGA CCG GCG GCC CGA CGC 
19179 19188 19197 19206 19215 19224 

CCA CCG GGC GGC CGT CGT GGC GAC CGG CCG GGA CGA ACT GGC CGC CGG GCT GCG 

PPGGRRGDRPGRTGRRAA 
HR.AAVVATGRDELAAGLR 
TGRPSWRPAGTNWPPGCA 
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APWEPVRARDR * R P RAAP 
RQGSLFGRG TEDGPGRQR 
A S A V * SGAGPRTVPAAS G 

GCG CGA CCG GTG AGT CCT TGG GCG CGG GCC AGA GCA GTG GCC CCG GCG CGA CGG 
19233 19242 19251 19260 19269 19278 

CGC GCT GGC CAC TCA GGA ACC CGC GCC CGG TCT CGT CAC CGG GGC CGC GCT GCC 

RAGH SGTRARSRHRGRAA 
ALATQEPAPGLVTGAALP 
RWPLRNPRPVSSPGPRCR 

HRGDRRPTRPDRTGTPRS 
I GATGDPHERTVPGLPGP 
S APRGTQTNEP*PDWHAP 

CCT ACG GCC GGC AGG GCA GAC CCA CAA GAG CCC AGT GCC CAG GGT CAC CCG GCC 
19287 19296 19305 19314 19323 19332 

GGA TGC CGG CCG TCC CGT CTG GGT GTT CTC GGG TCA CGG GTC CCA GTG GGC CGG 

GCRP SRLGVLGSRVPVGR 
DAGRPVWVFSGHGSQWAG 
MPAVPSGCSRVTGPSGPG 

P GRVAP LRAPRRRP SRRV 
-HAAFQQFGLRDEGLHDVF 
IPRSSSSASGTKASTISS 

CTA CCC GGC GCT TGA CGA CCT TCG GCT CGG CCA GAA GCG GCT CCA CTA GCT GCT 
19341 19350 19359 19368 19377 19386 

GAT GGG CCG CGA ACT GCT GGA AGC CGA GCC GGT CTT CGC CGA GGT GAT CGA CGA 

DGPRTAGSRAGLRR. GDRR 
MGRELLEAEPVFAEV I D E 
WAAN CWKPS RS S PR * S T N 

PAPT*PPSRTRAGASAAP 
QLRHELLLDPERGPLHQQ 
SSGTNLSSIPNEGRCISS 

TGA CCT CGG CCA CAA GTT CCT CCT CTA GCC CAA GAG CGG GGC CGT CTA CGA CGA 
19395 19404 19413 19422 19431 19440 

ACT GGA GCC GGT GTT CAA GGA GGA GAT CGG GTT CTC GCC CCG GCA GAT GCT GCT 

TGAGVQGGDRVLAPADAA 
LEPVFKEEIGFSPRQML L 
WSRCSRRRSGSRPGRCC W 

PRGCRPRRRGSWSRRSAA 
LAVVGLDVAGLGHDERHL 
SPSWVSTSPAWVMIKAI C 

CCT CCC GCT GGT GTG GCT CCA GCT GCC GCG GGT CTG GTA CTA GAA GCG CTA CGT 
19449 19458 19467 19476 19485 19494 

GGA GGG CGA CCA CAC CGA GGT CGA CGG CGC CCA GAC CAT GAT CTT CGC GAT GCA 
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G G R' P H FT G R V R R P D H D L R D A 
EGDHTEVDGAQTM I FAMQ 
RATTPRSTAPRP* S SRCS 

RARRATATVPRRARRR*r 
EPEGRQPP*PADLGGGDD 
SPSAASHRDRPTSGAATM 

CGA GCC CGA GCG GCG CGA CAC CGC CAG TGC CCC GCA GCT CGG GCG GCG GCA GTA 
19503 19512 19521 19530 19539 19548 

GCT CGG GCT CGC CGC GCT GTG GCG GTC ACG GGG CGT CGA GCC CGC CGC CGT CAT 

ARARRAVAVTGRRARRRH 
LGLAALWRSRGVEPAAV I 
SGSPRCGGHGASSPPPSS 

GSPRHSRRRR*RRPASR S 
AVRDTLD'GGGDGGPRQGH 
PWETPS I AAATVAPASVT 

GCC GGT GAG CCA GCC ACT CTA GCG GCG GCG GCA GTG GCG GCC CCG CGA CTG GCA 
19557 19566 19575 19584 19593 19602 

CGG CCA CTC GGT CGG TGA GAT CGC CGC CGC CGT CAC CGC CGG GGC GCT GAC CGT 

RPLGR *DRRRRHRRGADR 
GHSVGE I AAAVTAGAL TV 
^ATR S VR SPPPSPP GR * P * 

RRP GASRGYTAAAARPRP 
GVPGPQDATPRQQQALGR 
VSPARSIQRLDSSSRSAA 

CTG GCT GCC CCG GGC CGA CTA GAC GGC ATC CAG CGA CGA CGA CGC GCT CCG GCG 
19611 19620 19629 19638 19647 19656 

GAC CGA CGG GGC CCG GCT GAT CTG CCG TAG GTC GCT GCT GCT GCG CGA GGC CGC 

DRRGPADLP*VAAAARGR 
TDGARL I CRRSLLLREAA 
PTGPG* SAVGRCCCARPR 

AHR SPSP*DARRRPRRAA 
PTARHRHDTQGEVLGGLP 
PRPA IAI TLRGKS SAASR 

CCC CGC ACC GCG CTA CCG CTA CCA GTC AGA CGG GAA GCT GCT CCG GCG GCT CGC 
19665 19674 19683 19692 19701 19710 

GGG GCG TGG CGC GAT GGC GAT GGT CAG TCT GCC CTT CGA CGA GGC CGC CGA GCG 

GAWRDGDGQSALRRGRRA 
GRGAMAMVSLPFD EAAER 

GVARWRWSVCPSTRPPSG 

RPCHRPPRPWRTRSSTWR 
ERA I VRHDRGDRGRRRGG 
SAPL SATTAAMAD EVVDV 



CGA GCG CCC GTT ACT GCG CCA CCA GCG CCG GTA GCG CAG GAG CTG CTG CAG GTG 
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197T9 T97Z8 19737 19746 19755^ ; 19764 

GCT CGC GGG CAA TGA CGC GGT GGT CGC GGC CAT CGC GTC CTC GAC GAC GTC CAC 



ARGQ*RGGRGHRVLDDVH 
LAGNDAVVAAIASSTTST 
SRAMTRWSRPSRPRRRp] 

SRRHGRRPRSPRRGSSR] 
HDGTVGALDLLDDAAPGV 
TIEPSGPSTSFTTPRQVS 

GCA CTA GAG GCC ACT GGG GCC GCT CCA GCT CTT CCA GCA GCC GGC GAC CTG GCT 
19773 19782 19791 19800 19809 19818 

CGT GAT CTC CGG TGA CCC CGG CGA GGT CGA GAA GGT CGT CGG CCG CTG GAC CGA 

RDLR*PRRGREGRRP LDR 
VI SGDPGEVEKVVGRWTD 
*SPVTPARSRRSSAAGP r 

PAPRVAPRRRRPRGCGA ( 
LPQDYPPDGGVHGEVARV 
SPSTTRRTAESTAKWLGC 

GCT CCC CGA CCA GCA TGC CGC CCA GCG GAG GCT GCA CCG GAA GGT GTC GGG CGT 
19827 19836 19845 19854 19863 19872 

CGA GGG GCT GGT CGT ACG GCG GGT CGC CTC CGA CGT GGC CTT CCA CAG CCC GCA 

RGAGRTAGRLRRGLPQPA 
EGLVVRRVASDVAFHSPH 
RGWSYGGSPPTWPSTAR 1 : 

PGGARGAARPRRRA SDWI 
HVGQEVPQARGGVLQTGA 
MSGRSSRSRAAASSSLGL 

GTA CCT GGG GGA CGA GCT GGC CGA CGC GCG CCG GCG GCT GCT CGA CTC AGG GTC 
19881 19890 19899 19908 19917 19926 

CAT GGA CCC CCT GCT CGA CCG GCT GCG CGC GGC CGC CGA CGA GCT GAG TCC CAG 

HGPPARPAARGRRRAESQ 
MDPLLDRLRAAADELSPS 
WTPCSTGCARPPTS * V P I 

VACAARCSPARPGAPWP £ 
CRVRREVRRRERVRP GRH 
AGCVGS *VVASASGRAVT 

GCG TGG CGT GTG CGG CGA GAT GTG CTG CCG CGA GCG CCT GGG CGC CCG GTG CCA 
19935 19944 19953 19962 19971 19980 

CGC ACC GCA CAC GCC GCT CTA CAC GAC GGC GCT CGC GGA CCC GCG GGC CAC GGT 

RTAHAALHDGARGPAGHG 
APHTPLYTTALADPRATV 
HRTRRS TRRRSRTRGPR * 

R R ,. W R RT SPPSGACGPAARF 
GGVARVPRRVQAVRHPE G 
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V A S P A Y Q A A F R R £ G T R * S A 



CTG GCG GCT GCC GCG CAT GAC CCG CCG CTT GGA CGC GTT GGG CCA CGC CGA GCG 
19989 19998 20007 20016 20025 20034 

GAC CGC CGA CGG CGC GTA CTG GGC GGC GAA CCT GCG CAA CCC GGT GCG GCT CGC 

DRRRRVLGGEPAQPG AAR 
TADGAYWAANLRNPVRLA 
PPTARTGRRTCATRCGSP 

RS*RPPRPRGGPTRRATG 
GRDGRRGLVAVPREDLQG 
AAIVAAAS SP WRANT S SD 

GCG GCG CTA GTG GCG CCG CCG GCT CCT GCC GGT GGC CCG CAA GCA GCT CGA CAG 
20043 20052 20061 20070 20079 20088 

CGC CGC GAT CAC CGC GGC GGC CGA GGA CGG CCA CCG GGC GTT CGT CGA GCT GTC 

RRDHRGGRGRPPGVRRAV 
AAI TAAAEDGHRAFVE L S 
P RS PRRPRTAT GR S S S C P 

AGRPRAS SGRSAPRVRRP 
RVGHDRVRDVLRQGFAAH 
GCGTTACEIWSVSASRPT 

GGG CGT GGG GCA CCA GCG CGT GAG CTA GGT GCT CTG CGA CCG GCT TGC GCC GCA 
20097 20106 20115 20124 20133 20142 

CCC GCA CCC CGT GGT CGC GCA CTC GAT CCA CGA GAC GCT GGC CGA ACG CGG CGT 

PAPRGRALDPRDAGRTRR 
PHPVVAHSIHETLAERGV 
RTPWSRTRSTRRWPN AAW 

PRTRRVSAVACGARPGSR 
LVHEDSRR*PAVLGLGPG 
SSTNTPGVSRRLWGSARV 

CCT CCT GCA CAA GCA GCC TGG CTG CGA TGC CGC GTT GGT CGG GCT CCG GGC CTG 
20151 20160 20169 20178 20187 20196 

GGA GGA CGT GTT CGT CGG ACC GAC GCT ACG GCG CAA CCA GCC CGA GGC CCG GAC 

GGRVRRTDATAQPARGPD 
EDVFVGPTLRRNQPEART 
RTCSSDRRYGATSPRPGP 

GRRRPRRGSGRRSRP STP 
EAGGHAGGVAVAHAHVP R 
KRAATPAAWQWPTLTSQD 

GAA GGC GCG GCG GCA CCC GCG GCG GGT GAC GGT GCC GCA CTC GCA CCT GAC CAG 
20205 20214 20223 20232 20241 20250 

CTT CCG CGC CGC CGT GGG CGC CGC CCA CTG CCA CGG CGT GAG CGT GGA CTG GTC 

LPRRRGRRPLPRRERGLV 
FR.AAVGAAHCHGVSVDW S 
SAPPWAPPTATA*AWTGR 
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AGASRSGRLGAARGRAAC 
RE LRVPVE FDQRGVGP L V 
ASWGFPFRSTRGG*GQCC 

CCG CGA GGT CGG CTT GCC CTT GGA GCT TCA GGA CGG CGG GAT GGG GAC CGT CGT 
20259 20268 20277 20286 20295 20304 

GGC GCT CCA GCC GAA CGG GAA CCT CGA AGT CCT GCC GCC CTA CCC CTG GCA GCA 

GAPAEREPRSPAALPLAA 
ALQPNGNLEVLPPYPWQH 
RSSRTGTSKSCR PTPGS' 

GATANWRRPALPRARGRI 
ARQPTGDGPRSRGLAAVV 
RGSHREMAPARAASRPWS 

GGC GGG CGA CAC CGC AAG GTA GCG GCC CCG CGC TCG CCG GCT CGC GCC GGT GCT 
20313 20322 20331 20340 20349 20358 

CCG CCC GCT GTG GCG TTC CAT CGC CGG GGC GCG AGC GGC CGA GCG CGG CCA CGA 

PPAVAFHRRGASGRARPR 
RPLWRS IAGARAAERGHD 
ARCGVPSPGRERPSAAT 1 

RSGCAAPCARRRRP CRGJ 
DVGVRQQARGAADRAAVQ 
TSEWVSSPVGPPTAPLSR 

GCA GCT GAG GGT GTG CGA CGA CCC GTG CGG GCC GCC GCA GCG CCC GTC GCT GGA 
20367 20376 20385 20394 20403 20412 

CGT CGA CTC CCA CAC GCT GCT GGG CAC GCC CGG CGG CGT CGC GGG CAG CGA CCT 

RRLPHAAGHARRRRGQRP 
VD SHTL LGTPGGVAGS D L 
STPTRCWARPAASRAAT ( 

A TACCAPRRCGGTGPCGI 
PQPVARQVVVAARVRAAV 
RSHCLVSSSSLRGYGPLW 

CGC CGA CAC CGT GTC GTG CGA CCT GCT GCT GTC GGC GGG CAT GGG CCC GTC GGT 
20421 20430 20439 20448 20457 20466 

GCG GCT GTG GCA CAG CAC GCT GGA CGA CGA CAG CCG CCC GTA CCC GGG CAG CCA 

AAVAQHAGRRQPPVPGQP 
RLWHSTLDDDSRPYPGSH 
GCGTARWTTTAARTRAA1 

G*RRPSRGPRRAPP*TGI 
GEVAHLDDRGGHQRDREQ 
ARLPTS I TGAAT SATVNR 



GCG GGA GTT 
20475 
CGC CCT CAA 



GCC GCA CCT 
20484 
CGG CGT GGA 



CTA GCA GGG 
20493 
GAT CGT CCC 



CCG GCG GCA 
20502 
GGC CGC CGT 



CGA CCG CCA 
2051 1 
GCT GGC GGT 



GTG CAA GGA 
20520 
CAC GTT CCT 
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R.' p,,. QV R . R G , jy R p G R R A G G H V P 
ALNGVEIVPAAVLAVTFL 
PSTAWRSSRPPCWRSRSW 



PRRRPRLAGRGGPCS S S G 
RGAGLAFLAAGELVHR H G 
AAPASPSSRRARWSMVIV 

CCG CCG GCC GCG GCT CCC GCT TCT CGC GGC GCG GGA GGT CCT GTA CTG CTA CTG 
20529 20538 20547 20556 20565 20574 

GGC GGC CGG CGC CGA GGG CGA AGA GCG CCG CGC CCT CCA GGA CAT GAC GAT GAC 

GGRRRGRRAPRPP GHDDD 
AAGAEGEERRALQDMTMT 
RPAPRAKSAAP SRT * R * p 

GPASPPDAASGPRGRPRP 
VRHQRRTLPLDLDDALAL 
WGTSVAP*RCIWTTRSP S 

GGT GGG CCA CGA CTG CCG CCC AGT CGC CGT CTA GGT CCA GCA GGC GCT CCC GCT 
20583 20592 20601 20610 20619 20628 

CCA CCC GGT GCT GAC GGC GGG TCA GCG GCA GAT CCA GGT CGT CCG CGA GGG CGA 

PPGADGGSAADPGRPRGR 
HPVLT AGQRQIQVVREGE 
TRC *RRVSGR-SRS SARAR 

PAAPRGSPRPRRRGS GRR 

HHPQGGPRDRVGG VRVGG 
TTR S A E RV T A S ~ A A S G F GA 

CCA CCA CGC CGA CCG GAG GGC CTG CCA GCG CCT GCG GCG GCT GGG CTT GGG GCG 
20637 20646 20655 20664 20673 20682 

GGT GGT GCG GCT GGC CTC CCG GAC GGT CGC GGA CGC CGC CGA CCC GAA CCC CGC 

GGAAGLPDGRGRRRP EPR 
VVRLASRTVADAADPNPA 
WCGWPPGRSRTPPTRTPP 

ARGHRPGSPRAPGRRDPP 
PEDMGLGPRGRRVEGTQR 
QSTWASARVAAGSRAPRA 

GAC CGA GCA GGT ACG GCT CCG GGC CTG CCG GCG CGG CCT GGA GCG GCC AGA CCG 
20691 20700 20709 20718 20727 20736 

CTG GCT CGT CCA TGC CGA GGC CCG GAC GGC CGC GCC GGA CCT CGC CGG TCT GGC 

LARPCRGPDGRAGPRRSG 
WLVHAEARTAAPDLAGLA 
GSSMPRPGRPRRTSPVWR 

ATAAP GPRA GARVPR GR G 
RPRQQVRALVPEFRGVGA 
ARDSSSGPSCRSSGA'SGP 

CCG CGC CAG CGA CGA CCT GGG CCC GCT CGT GGC CGA GCT TGG CCG GCT GGG GCC 
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20745 20754 20763 20772 2'QTSV 20790 

GGC GCG GTC GCT GCT GGA CCC GGG CGA GCA CCG GCT CGA ACC GGC CGA CCC CGG 



GAVAAGPGRAPARTGRPR 
ARSLLDPGEHRLEPADPG 
RGRCWTRASTGSNRPTPi 

PRGAAPRPPRVRSRNRNJ 
QDGPPQGLHAYGRGTEI p 
RTERRSASTPTGEVPKSQ 

GGA CCA GAG GGC CGC CGA CCG GCT CCA CCC GCA TGG GAG CTG GCC AAA GCT AAC 
20799 20808 20817 20826 20835 20844 

CCT GGT CTC CCG GCG GCT GGC CGA GGT GGG CGT ACC CTC GAC CGG TTT CGA TTG 

PGLPAAGRGGRTLDRFRL 
LVSRRLAEVGVPSTGFDW 
WSPGGWPRWAYPRPVSI ( 

RRAVTRRDRHVARE PARJ 
ADL S Q GGTETYQV S L H E R 
LTSRSDAPRPTSCA* TSE 

CTC GCA GCT CGC TGA CAG GCG GCC AGA GCC ACA TGA CGT GCG AGT CCA CGA GAG 
20853 20862 20871 20880 20889 20898 

GAG CGT CGA GCG ACT GTC CGC CGG TCT CGG TGT ACT GCA CGC TCA GGT GCT CTC 

ERRATVRRSRCTARS GAL 
SVERL SAGLGVLHAQVL S 
ASSDCPPVSVYCTLRCSI 

RRRTRPGAAPRRST SRA3 
GVGRGPGRQQVGHHRDRR 
GSAEDQAGSSSAT ID IAG 

CGG GCT GCG GAG CAG GAC CCG GGG CGA CGA CCT GCG GCA CTA CAG CTA GCG CGG 
20907 20916 20925 20934 20943 20952 

GCC CGA CGC CTC GTC CTG GGC CCC GCT GCT GGA CGC CGT GAT GTC GAT CGC GCC 

ARRLVLGPAAGRRDVDRA 
PDAS SWAPLLDAVMS IAP 
PTPRPGPRCWTP*CRSRI 

RRRPGGAAGCPRARRRS * 
GGEHAERLEAHDHVDVLD 
AAKTPRGCSRMTTCT S S I 

CCG GCG GAA GCA CCC GGA GGG CGT CGA GGC GTA CCA GCA CGT GCA GCT GCT CTA 
20961 20970 20979 20988 20997 21006 

GGC CGC CTT CGT GGG CCT CCC GCA GCT CCG CAT GGT CGT GCA CGT CGA CGA GAT 

GRLRGPPAAPHGRARRRD 
AAFVGLPQLRMVVHVDE I 
PPSWASRSSAWSCTSTRS 

R R -R CAVPPPSPRPRARDG 
GDVARWRLRRRDLDRE I G 
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GTG GCA GCT GCC GTG CGG TGG CCT CCG CCG CTG CCA GCT CCA GCG CGA GCT AGG 
21015 21024 21033 21042 21051 21060 

CAC CGT CGA CGG CAC GCC ACC GGA GGC GGC GAC GGT CGA GGT CGC GCT CGA TCC 

HRRRHATGGGDGRGRARS 
TVDGTPPEAATVEVALDP 
PSTARHRRRRRSRSRS I P 

RRRCRARGP*PRPPVGPP 
ADGVGHVGQDRVPL SARH 
RTASVTCARTVSPSPRGT 

GGC GCA GCG GCT GTG GCA CGT GCG GGA CCA GTG CCT GCC CCT CCC TGC GGG CCA 
21069 21078 21087 21096 21105 21114 

CCG CGT CGC CGA CAC CGT GCA CGC CCT GGT CAC GGA CGG GGA GGG ACG CCC GGT 

PRRRHRARPGHGRGGTPG 
RVADTVHALVTDGE GRPV 
AS PTPCTPWSRTGRDARW 

SGARGASGPPRAAPRAP C 
RAQAAQAVRHDLLRGRRV 
ALRRPRR*GTTSCGAAGS 

CCG CTC GGA CGC GCC GGA CGC GAT GGG CCA CCA GCT CGT CGG CCG GCG CGG CCT 
21123 21132 21141 21150 21159 21168 

GGC GAG CCT GCG CGG CCT GCG CTA CCC GGT GGT CGA GCA GCC GGC CGC GCC GGA 

GEPARPALPGGRAAGRAG 
ASLRGLRYPVVEQPAAPD 
RACAACATRWSSSRPRRT 

RRAPRRRPRPRPT TRPDT 
GVLRAAVRVRVHHRERTQ 
VSSGPPSASASTTDNAPR 

GTG GCT GCT CGG CCC GCC GCT GCG CCT GCG CCT GCA CCA CAG CAA GCG CCC AGA 
21177 21186 21195 21204 21213 21222 

CAC CGA CGA GCC GGG CGG CGA CGC GGA CGC GGA CGT GGT GTC GTT CGC GGG TCT 

HRRAGRRRGRGRGVVRGS 
TDEPGGDADADVVS FAGL 
PTSRAATRTRTWCRSRVC 

APPAANGPARRPARASRA 
RRLLQTGPHEVLHALLDR 
DGSSSRERTSSSTRSCIA 

CAG CGG CCT CCT CGA CGC AAG GGC CCA CGA GCT GCT CCA CGC GCT CGT CTA GCG 
21231 21240 21249 21258 21267 21276 

GTC GCC GGA GGA GCT GCG TTC CCG GGT GCT CGA CGA GGT GCG CGA GCA GAT CGC 

VAGGAA FPGARRGARADR 
SPJ5ELRSRVLDEVREQIA 
RRRSCVPGCSTRCASRSR 
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PSAVRGWPGAREGGAPPA 
LLHSEGGRGQVNAARQHL 
CS IRSAGVARCTRRGSTS 

CGT CCT CTA CGC TGA GCG GGG GTG CCG GGA CGT GCA AGC GGC GGG CGA CCA CCT 
21285 21294 21303 21312 21321 21330 

GCA GGA GAT GCG ACT CGC CCC CAC GGC CCT GCA CGT TCG CCG CCC GCT GGT GGA 

AGDATRPHGPARSPPAGG 
QEMRLAPTALHVRRPLVE 
RRCDSPPRPCTFAARWWS 

PARSPSSPPPGGGAPSAG 
LPEVRHHRHHDAAPQLLA 
CPSSET IVTTTRRRS SFR 

CGT CCC CGA GCT GAG CCA CTA CTG CCA CCA CCA GGC GGC GGC CGA CCT CTT CGC 
21339 21348 21357 21366 21375 21384 

GCA GGG GCT CGA CTC GGT GAT GAC GGT GGT GGT CCG CCG CCG GCT GGA GAA GCG 

AGARLGDDGGGPPPAGEA 
QGLD S VMTVVVRRRL E KR 
RG.STR**RWWSAAGWRSA 

RGPRAPWCRRSAAWW*RC 
EAPVHRGVDEPLQGGDAV 
RPRSTGALMKQF SGVMLS 

GGA GCC GGC CCT GCA CGG CCG GTT GTA GAA GAC CTT CGA CGG GTG GTA GTC GCT 
21393 21402 21411 21420 21429 21438 

CCT CGG CCG GGA CGT GCC GGC CAA CAT CTT CTG GAA GCT GCC CAC CAT CAG CGA 

PRPGRAGQHLLEAAHHQR 
LGRDVPANIFWKLPT I SD 
SAGTCRPTSSGSCPPSAT 

RRDGSRVG*PVGSP"PRGH 
DDIVQGFAERFVRRRVAM 
MTS*RVSRR VSCGVASPW 

GTA GCA GCT AGT GGA CTG GCT TGC GGA GTG CCT TGT GGG CTG CCG CCT GCC GGT 
21447 21456 21465 21474 21483 21492 

CAT CGT CGA TCA CCT GAC CGA ACG CCT CAC GGA ACA CCC GAC GGC GGA CGG CCA 

HRRSPDRTPHGTPDGGRP 
IVDHLTERLTEHPTADGH 
S S I T * PNASRNTRRR TA M 

TRFASVGYSMDAP SPPTF 
RGSRVSETV*TLLPRRPS 
ADQVCQSRLEH*CPVAPH 

ACG CAG GAC TTG CGT GAC TGA GGC ATT GAG TAC AGT CGT CCC CTG CCG CCC CAC 
21 501 21 51 0 21 519 21528 21 537 21 546 

TGC GTC CTG AAC GCA CTG ACT CCG TAA CTC ATG TCA GCA GGG GAC GGC GGG GTG 
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C V L N A L T P *" L M S AG' D G G V 
AS*TH*LRNSCQQGTAG* 
RPERTDSVTHVSRGRRGE 

PGRWGARFGLSFRFFVGT 
LAAGAPGSV*PFGSFCAL 
FPRALRGPFRPFVQFVRW 

TTT CCC GGC GCG GTC GGC CGG GCC TTT GGA TCC CTT TTG GAC TTT TTG TGC GGT 
21555 21564 21573 21582 21591 21600 

AAA GGG CCG CGC CAG CCG GCC CGG AAA CCT AGG GAA AAC CTG AAA AAC ACG CCA 

KGPRQPARKPRENLKNTP 
KGRASRPGNLGKT*KTRQ 
RAAPAGPET*GKPEKHAS 

RDNNPPSMRHWRSNGQF S 
VI TTPRLCEIGDPTGKFR 
YSRQQASVNSAMQLERSV 

CAT GCT AGC AAC AAC CCG CCT CTG TAA GCT ACG GTA GAC CTC AAG GGA ACT TTG 
21609 21618 21627 21636 21645 21654 

GTA CGA TCG TTG TTG GGC GGA GAC ATT CGA TGC CAT CTG GAG TTC CCT TGA AAC 

VRSLLGGDIRCHLE FP * N 
YDRCWAETFDAIWS SLET 
TIVVGRRHSMPSGVPLKR 

RIQRRQGCPTPYSPA* I p 
GSRVASVALHPI HLREYQ 
VQDSPASRLTHSI FASMN 

CTG GAC TAG ACT GCC GCG ACT GGC GTT CCA CAC CCT ATA CTT CCG CGA GTA TAA 
21663 21672 21681 21690 21699 21708 

GAC CTG ATC TGA CGG CGC TGA CCG CAA GGT GTG GGA TAT GAA GGC GCT CAT ATT 

DLI*RR*PQGVG Y^^ E G A H I 
T* SDGADRKVWD (m) K A L I L 
PDLTALTARCGI *RRSYW 

— ^ 

PRPQSSAAAS*AYRPWVV 
HAPNARPQPRNRMGRGFL 
TPPTPELSRGIVCVEALC 

CCA CCC GCC CCA ACC GAG CTC CGA CGC CGG CTA ATG CGT ATG GAG CCG GTT TGT 
21717 21726 21735 21744 21753 21762 

GGT GGG CGG GGT TGG CTC GAG GCT GCG GCC GAT TAC GCA TAC CTC GGC CAA ACA 

GGRGWLEAAADYAYL GQT 
VGGVGSRLRPITHTSAKQ 
WAGLARGCGRLR I PRPNN 

PGPPWYFQERRHVPNW*P 
QDRHGI SSNEGIYQIGDL 
STGTALLVTRE*TSSEMIi 



TGA CCA GGG CCA CCG GTT ATC TTG ACA AGA GAG GAT ACA TGA CCT AAG GTA GTT 
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21 77 T 21780 21789 21798 2T807 21816 

ACT GGT CCC GGT GGC CAA TAG AAC TGT TCT CTC CTA TGT ACT GGA TTC CAT CAA 



TGPGGQ*NCSLLCTGFHQ 
LVPVANRTVLSYVLDS IK 
WSRWP I ELFSPMYWI P SR 

PRFIPPRSQRRPSRPPSG 
LGSYRLDPNDDPRGRRLD 
SAPIDSTPITTPAVAAS I 

CCT CCG GCC TTA TAG CCT CCA GCC CTA ACA GCA GCC CCG CTG GCG CCG CCT CTA 
21825 21834 21843 21852 21861 21870 

GGA GGC CGG AAT ATC GGA GGT CGG GAT TGT CGT CGG GGC GAC CGC GGC GGA GAT 

GGRN IGGRDCRRGDRGGD 
EAGI SEVGIVVGATAAE I 
RPEYRRSGLSSGRPRRRs 

PKRPLRRPTRGPR*RCGA 
LSGHSVARLEAQVDGVDL 
WAETPSPASNPRSTV* MW 

GGT CCG AAG GCA CCC TCT GCC GCG CCT CAA GCC GGA CCT GCA GTG GAT GTA GGT 
21879 21888 21897 21906 21915 21924 

CCA GGC TTC CGT GGG AGA CGG CGC GGA GTT CGG CCT GGA CGT CAC CTA CAT CCA 

PGFRGRRRGVRPGRHL HP 
QASVGDGAEFGLDVTY I Q 
RLPWETARSSAWTSPT S S 

PRGARAPRRRARTGH S GR 
LVGRAPQGVGHEHGT V E E 
CSAGRPSASATSTDRSKR 

CGT CCT GCG GGG CGC GCC CGA CCG GCT GCG GCA CGA GCA CAG GGC ACT GAA GGA 
21933 21942 21951 21960 21969 21978 

GCA GGA CGC CCC GCG CGG GCT GGC CGA CGC CGT GCT CGT GTC CCG TGA CTT CCT 

AGRPARAGRRRARVP* LP 
QDAPRGLADAVLVSRDFL 
RTPRAGWPTPCSCPVT S S 

RRRSR* TGPRCSRRPRCR 
AVVVEDHVQAVVVDHVAD 
PSSSKTMYRPSL*TTSPM 

GCC GCT GCT GCT GAA GCA GTA CAT GGA CCC GCT GTT GAT GCA GCA CCT GCC GTA 
21987 21996 22005 22014 22023 22032 

CGG CGA CGA CGA CTT CGT CAT GTA CCT GGG CGA CAA CTA CGT CGT GGA CGG CAT 

RRRRLRHVPGRQLRRGRH 
GDDD FVMYLGDNYVVD GI 
ATTTSSCTWATTTSWTAS 

RS .RPPSGGRCARRAP * AR 
DVEHRVEAAVLGGRLDHE 
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GCA GCT GAA GCA CCG CCT GAA GGC GGC GCT GTT CGG GCG GCG CGT CCA GTA CGA 
22041 22050 22059 22068 22077 22086 

CGT CGA CTT CGT GGC GGA CTT CCG CCG CGA CAA GCC CGC CGC GCA GGT CAT GCT 

RRLRGGLPPRQARRAGHA 
VDFVADFRRDKPAAQVML 
STSWRTSAATSPPRRSCS 

GPRRGACTRRPRVQR SRG 
GPDGVRAPEAHGFKVLVA 
ARTASGRLNPTASSS SFP 

GCG GGC CCA GCG GCT GGG CGC GTC CAA GCC GCA CCG GCT TGA ACT GCT CTT GCC 
22095 22104 22113 22122 22131 22140 

CGC CCG GGT CGC CGA CCC GCG CAG GTT CGG CGT GGC CGA ACT TGA CGA GAA CGG 

RPGRRPAQVRRGRT * R ER 
ARVADPRRFGVAEL DENG 
PGSPTRAGSAWPNLTRTA 

PSRPRPSAGPGWSRGPSR 
PHGRDHLLGLVGPAVQRD 
RTVATTSFGWSGLLSRAI 

GGC CCA CTG GCG CCA GCA CCT CTT CGG GGT CCT GGG GTC CTC GCT GGA CCG CTA 
22149 22158 22167 22176 22185 22194 

CCG GGT GAC CGC GGT CGT GGA GAA GCC CCA GGA CCC CAG GAG CGA CCT GGC GAT 

PGDRGRGEAPGPQERPGD 
RVTAVVEKPQDPRSD LA I 
G*PRSWRSPRTPGATWRS 

RRTRR* SPRARPRPRCGA 
DAHVGEARGHVLGHGADP 
TPTYAKLEATCSATAPMR 

GCA GCC GCA CAT GCG GAA GTC GAG CCG GCA CGT GCT CCG GCA CCG GCC GTA GGC 
22203 22212 22221 22230 22239 . 22248 

CGT CGG CGT GTA CGC CTT CAG CTC GGC CGT GCA CGA GGC CGT GGC CGG CAT CCG 

RRRVRLQLGRARGRGRHP 
VGVYAF S SAVHEAVAG I R 
SACTPSARPCTRPWPASG 

TRAS RAPS*RRGATAPRG 
RGPP VLQLDGVG Q L P Q G V 
GDQRFSSSIVSARCHSAS 

CGG CAG GAC CGC CTT GCT CGA CCT CTA GTG GCT GCG GGA CGT CAC CGA CCG GCT 
22257 22266 22275 22284 22293 22302 

GCC GTC CTG GCG GAA CGA GCT GGA GAT CAC CGA CGC CCT GCA GTG GCT GGC CGA 

AVLAE RAGDHRRPAVAGR 
PS ,WRNELEITDALQWLAD 
RPGGTSWRSPTPCSGWPT 
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RARPRSWPSRGTSSPRRS 
VPVLDAGRHDVPVPLVDR 
WPCSTPEVTISRYQFSTA 

GGT GCC CGT GCT CCA GCC GAG GTG CCA CTA GCT GGC CAT GAC CTT CCT GCA GCG 
22311 22320 22329 22338 22347 22356 

CCA CGG GCA CGA GGT CGG CTC CAC GGT GAT CGA CCG GTA CTG GAA GGA CGT CGC 

PRARGRLHGDRPVLE GRR 
HGHEVGSTVIDRYWKDVA 
TGTRSAPR*STGTGRTSR 

R*RRGPSSGAGAPTGPSG 
ADGVDQLHVPVQQLG'Q L G 
LTVSTRSIFRCRSSDRSV 

CTC GCA GTG GCT GCA GGA CCT CTA CTT GGC CGT GGA CGA CCT CAG GGA CCT CTG 
22365 22374 22383 22392 22401 22410 

GAG CGT CAC CGA CGT CCT GGA GAT GAA CCG GCA CCT GCT GGA GTC CCT GGA GAC 

ERHRRP GDEPAPAGV P GD 
SVTDVLEMNRHLLES LET 
ASPTSWR*TGTCWSPWRP 

CRRRPPRPWRVPPGLRPP 
ADVALHVLGAFQHAS DHH 
RMSPST SSALSSTPRTTT 

GGC GTA GCT GCC GCT CCA CCT GCT CCG GTC GCT TGA CCA CCC GGC TCA GCA CCA 
22419 22428 22437 22446 22455 22464 

CCG CAT CGA CGG CGA GGT GGA CGA GGC CAG CGA ACT GGT GGG CCG AGT CGT GGT 

PHRR R G GRGQRT GGP S R G 
RIDGEVDEASELVGRVVV 
ASTARWTRPANWWAE SWW 

PPPS SRRSGCRRDRR * R G 
LRPRLD GAGADDTGGDDA 
SAPAFI EPERMTPGATMP 

CCT CCG CCC CCG CTT CTA GAG GCC GAG GGC GTA GCA GCC AGG GCG GCA GTA GCC 
22473 22482 22491 22500 22509 22518 

GGA GGC GGG GGC GAA GAT CTC CGG CTC CCG CAT CGT CGG TCC CGC CGT CAT CGG 

GGGGEDLRLPHRRSRRHR 
EAGAKI SGSRIVGPAVIG 
R RGRRSPAPASSVPP SS A 

PCPPAPSRGRDR*RWRPC 
RVRHHLVGVETGEGGDLA 
GSVTTCSE*RPGKVEMSP 

GGG CCT GTG CCA CCA CGT CCT GAG GAT GGA GCC AGG GAA GTG GAG GTA GCT CCC 
22527 22536 22545 22554 22563 22572 

CCC GGA CAC GGT GGT GCA GGA CTC CTA CCT CGG TCC CTT CAC CTC CAT CGA GGG 
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P G" H-' G" G~ K G' E L P R S L' FT E H R G 
PDTVVQDSYLGPFTS I EG 
RTRWCRTPTSVPSPP SRA 

SGPRACRSGTSSRAAHRK 
VAPDRVALDLVRDHQTAS 
LQRTACLSIWYEITSRPA 

GTT GAC GGC CCA GCG CGT GTC GCT CTA GGT CAT GAG CTA GCA CGA CGC ACC GCG 
22581 22590 22599 22608 22617 22626 

CAA CTG CCG GGT CGC GCA CAG CGA GAT CCA GTA CTC GAT CGT GCT GCG TGG CGC 

QLPGRAQRDPVLDRAAWR 
NCRVAHSEIQYSIVLRGA 
TAGSRTARSSTRSCCVAL 

SRPLRGHRPSPS RGPSRP 
RDLSDGTDLVRHDAPLGL 
EISPTARTSSETIPRSVS 

AAG CTA GCT CCC TCA GCG GGC ACA GCT CCT GAG CCA CTA GCC GGC CCT CTG GCT 
22635 22644 22653 22662 22671 22680 

TTC GAT CGA GGG AGT CGC CCG TGT CGA GGA CTC GGT GAT CGG CCG GGA GAC CGA 

FDRGSRPCRGLGDRPGDR 
S IEGVARVEDSVI GRE T E 
RSRESPVSRTR*SAGRPR 

SRRGGSTSRAGAPAP LGC 
HVGGGPRRGRVPQHQSVV 
TFAAGRVDVACRSTSP SW 

CCA CTT GCG GCG GGG GGC CTG CAG CTG GCG CGT GGC CGA CCA CGA CCC TCT GGT 
22689 22698 22707 22716 22725 22734 

GGT GAA CGC CGC CCC CCG GAC GTC GAC CGC GCA CCG GCT GGT GCT GGG AGA CCA 

GERRPPDVD RAPAGAGRP 
VNAAPRTSTAHRLVLGDH 
*TPPPGRRPRTGWCWETT 

GPGPRRNFLGASAP SAVT 
APDLDATSCAQPPPPRSP 
LRTWTPPQVPRRLRPVRR 

GTC GGC CCA GGT CCA GCC GCC AAC TTG TCC GGA CGC CTC CGC CCC CTG CGC TGC 
22743 22752 22761 22770 22779 22788 

CAG CCG GGT CCA GGT CGG CGG TTG AAC AGG CCT GCG GAG GCG GGG GAC GCG ACG 

QPGPGRRLNRPAEAGDAT 
SRVQVGG*TGLRRRGTRR 
AGSRSAVEQACGGGGRDG 

FAA*PFMRSPLAPASRPR 
SPPKRSCALRCRPHPVPV 
HLRSVP VHSVAARTR F P S 



CAC TTC CGC CGA ATG CCC TTG TAC GCT CTG CCG TCG CGC CCA CGC CTT GCC CCT 
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22797 22806 22815 22824 Z2833 2284 2 

GTG AAG GCG GCT TAC GGG AAC ATG CGA GAC GGC AGC GCG GGT GCG GAA CGG GGA 

V K A A Y G N RDGSAGAERG 
*RRLTGTCETAARVRNGD 
EGGLREHARRQRGCGTG^ 



CTRTMPPAPKMPEWYTR < 
ARGP*RHLPS*RSGTRAR 
PVDQDDT SRAEDAGLVHA 

GCC GTG CAG GAC CAG TAG CCA CCT CGC CCG AAG TAG CCG AGG GTC ATG CAC GCG 
22851 22860 22869 22878 22887 22896 

CGG CAC GTC CTG GTC ATC GGT GGA GCG GGC TTC ATC GGC TCC CAG TAC GTG CGC 

RHVLVI GGAGF IGSQYVR 
GTSWSSVERASSAPSTCA 
ARPGHRWSG LHRLPVRAI 

STRSPSGARTVTSSL S V ^ 
VPGPRRDPAPSRAPCASR 
F QDPVAIRRPHGHQVLQG 

CTT GAC CAG GCC CTG CCG CTA GGC CGC GCC CAC TGG CAC GAC CTG TTC GAC TGG 
22905 22914 22923 22932 22941 22950 

GAA CTG GTC CGG GAC GGC GAT CCG GCG CGG GTG ACC GTG CTG GAC AAG CTG ACC 

ELVRDGDPARVTVLDKLT 
NWSGTAIRRG*PCWTS * P 
TGPGRRSGAGDRAGQAD1 

APFRAF RSGTAPRYVKT ( 
RRSGPSGPAPRRGTCRRA 
VGPVQRVQLRDGAPVGEH 

ATG CGG CCC TTG GAC CGC TTG GAC CTC GGC CAG CGG CCG GCC ATG TGG AAG CAC 
22959 22968 22977 22986 22995 23004 

TAC GCC GGG AAC CTG GCG AAC CTG GAG CCG GTC GCC GGC CGG TAC ACC TTC GTG 

YAGNLANLEPVAGRYT FV 
TPGTWRTWSRSP AGTPSC 
RREPGEPGAGRRPVHLRi 

PSM QSALSSASTTGPWSI 
RRCRRHWAARRPPGR GRD 
VAVDAI GPQEGLHDGAVI 

GTG CCG CTG TAG ACG CTA CGG TCC GAC GAG CGG CTC CAC CAG GGG CCG GTG CTA 
23013 23022 23031 23040 23049 23058 

CAC GGC GAC ATC TGC GAT GCC AGG CTG CTC GCC GAG GTG GTC CCC GGC CAC GAT 

HGD I CDARLLAEVVPGHD 
TATSAMPGCSPRWSPAT I 
RRHLRCQAARRGGPRPRc 

T T ,,..L KAASDCTSRDIA S A I 
PP*SRPRIARRGTSRRRP 
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GAC CAC CAG TTG AAG CGC CGG CTT AGC GTG CAG CTG GCC AGC TAG CGG CTG CGC 
23067 23076 23085 23094 23103 23112 

CTG GTG GTC AAC TTC GCG GCC GAA TCG CAC GTC GAC CGG TCG ATC GCC GAC GCG 

LVVNFAAE SHVDRS I ADA 
WWSTSRPNRTSTGRSPTR 
GGQLRGRIARRPVDRRRG 

GNMRVLTCPTWASMCTHR 
AT*VYWHAPRGPV*APTG 
RREYTGIHLADLCEHLHA 

CGC GGC AAG TAT GCA TGG TTA CAC GTC CCG CAG GTC CGT GAG TAC GTC CAC ACG 
23121 23130 23139 23148 23157 23166 

GCG CCG TTC ATA CGT ACC AAT GTG CAG GGC GTC CAG GCA CTC ATG CAG GTG TGC 

APFI RTNVQGVQALMQVC 
RRSYVPMCRASRHS CRCA 
AVHTYQCAGRPGTHAGVP 

SAPVALITCTEVSSTYPL 
PPRCPWSRAPRWRRPTRC 
QLGARGPDHLDGGVL H V A 

GAC CTC CGG CCG TGC CGG TCC TAG CAC GTC CAG AGG TGG CTG CTC CAC ATG CCG 
23175 23184 23193 23202 23211 23220 

CTG GAG GCC GGC ACG GCC AGG ATC GTG CAG GTC TCC ACC GAC GAG GTG TAC GGC 

LEAGTAR IV QVSTDEVYG 
WRPARPGSC RSPPTRCTA 
GGRHGQDRAGLHRRGVRQ 

MSVPEQSSSAGIAGLEG* 
CRSPSRP RPRASRGWSAR 
ADLRAGPVLVRRDGGVRG 

TCG TAG CTC TGC CCG AGG ACC CTG CTC CTG CGC GGC TAG CGG GGG TTG AGC GGG 
23229 23238 23247 23256 23265 23274 

AGC ATC GAG ACG GGC TCC TGG GAC GAG GAC GCG CCG ATC GCC CCC AAC TCG CCC 

SIETGSWDEDAPIAPNSP 
ASRRAPGTRTRRSPP TRP 
HRDGLLGRGRADRPQ LAL 

AADLAPPSMTARA*ARVW 
RPTWPPRRCPRGRRRGCG 
VRRGLRAAVHDGEGVGAG 

ATG CGC CGC AGG TTC CGC CCG CCG CTG TAC CAG CGG GAG CGG ATG CGG GCG TGG 
23283 23292 23301 23310 23319 23328 

TAC GCG GCG TCC AAG GCG GGC GGC GAC ATG GTC GCC CTC GCC TAC GCC CGC ACC 

YAAS KAGGDMVALAYART 
TR .RPRRAATWSPSPTPAP 
RGVQGGRRHGRPRLRPHP 
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PSGTLTVRHPLL * P G * * N 
HAAPSRSATRCCSRARDT 
MPQRHAHRPAAVVVPG I L 

GTA CCC GAC GGC CAC TCG CAC TGC GCC ACG CCG TTG TTG ATG CCC GGG ATA GTC 
23337 23346 23355 23364 23373 23382 

CAT GGG CTG CCG GTG AGC GTG ACG CGG TGC GGC AAC AAC TAC GGG CCC TAT CAG 

HGLPVSVTRCGNNYGPYQ 
MGCR*A*RGAATTTGP I S 
WAAGERDAVRQQLRAL SV 

GSFTTGSNVVRSSSPWLM 
GPSPREAT*WGAAPRGC C 
ERLLDNRQEGGPQQVAVA 

AAG GGC CTC TTC CAG CAA GGC GAC AAG TGG TGG GCC GAC GAC CTG CCG GTG TCG 
23391 23400 23409 23418 23427 23436 

TTC CCG GAG AAG GTC GTT CCG CTG TTC ACC ACC CGG CTG CTG GAC GGC CAC AGC 

FPEKVVPLFTTRLLDGHS 
SRRRSFRCSPPGCWTATA 
PGEGRSAVHHPAAGRPQH 

GSYPSPPLT.RSQTCTDSW 
GATRPHRCRGPSPARTRG 
DRQVPIAAVDPVPHVHGV 

TAG GGC GAC ATG CCC CTA CCG CCG TTG CAG GCC CTG ACC CAC GTG CAC AGG CTG 
23445 23454 23463 23472 23481 23490 

ATC CCG CTG TAC GGG GAT GGC GGC AAC GTC CGG GAC TGG GTG CAC GTG TCC GAC 

IPLYGDGGNVRDWVHVSD 
SRCTGMAATSGTGCTCPT 
PAVRGWRQRPGLGARVRP 

TRPMRS TASRPSGPCT * W 
RAPCGAPRRVRAAPAPRG 
VHPADPQDGFAPQRPLDV 

GTG CAC GCC CCG TAG GCC GAC CAG CGG CTT GCG CCC GAC GGC CCC GTC CAG ATG 
23499 23508 23517 23526 23535 23544 

CAC GTG CGG GGC ATC CGG CTG GTC GCC GAA CGC GGG CTG CCG GGG CAG GTC TAC 

HVRGIRLVAERGLPGQVY 
TCGASGWSPNAGCRGRST 
RAGHPA GRRTRAAGA G L P 

MAPEASSVLRSSVCCSSS 
CRPSPRASWDPVSAVVA P 
VDRA RG L QGIQFQRL L QQ 

GTG TAG CGC CCG AGC CGG CTC GAC TGG TTA GAC CTT GAC TGC GTT GTT GAC GAC 
23553 23562 23571 23580 23589 23598 

CAC ATC GCG GGC TCG GCC GAG CTG ACC AAT CTG GAA CTG ACG CAA CAA CTG CTG 
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H I A G S A E t T' JST L E L T Q y Q L L 
TSRARPS*PIWN*RNNCW 
HRGLGRADQSGTDAT TAG 

ARPAPQSRTSRTGSRFPC 
RGPRRSPGPRAHVRGS PV 
VGQAGAPVPDLTYGVPL S 

CTG CGG GAC CCG CGG CCG ACC CTG GCC CAG CTC GCA CAT GGG CTG GCC TTC CCT 
23607 23616 23625 23634 23643 23652 

GAC GCC CTG GGC GCC GGC TGG GAC CGG GTC GAG CGT GTA CCC GAC CGG AAG GGA 

DALGAGWD RVERVPDRKG 
TPWAPAGTGSSVYPTGRD 
RPGRRLGPGRACTRPEGT 

S R R * E SHSARRPASP * A G 
RG-ASSATRRGGRRARSRV 
VVPAVRQAVGAEAREAVC 

GTG CTG GCC GCG ATG AGC GAC ACG CTG CGG GCG GAG CCG CGC GAG CCG ATG CGT 
23661 23670 23679 23688 23697 23706 

CAC GAC CGG CGC TAC TCG CTG TGC GAC GCC CGC CTC GGC GCG CTC GGC TAC GCA 

HDRRYS LCDARLGAL GYA 
TTGATRCATPASARSATH 
RPALLAVRRPPRRARLRT 

RTDNS CPRASVTRQYAS F 
GHTTRALGRRCRASTRR S 
GTHRELLAEGVGHAPVGL 

GGG GCA CAC AGC AAG CTC GTT CCG GAG CGG CTG TGG CAC GCG ACC ATG CGG CTC 
23715 23724 23733 23742 23751 23760 

CCC CGT GTG TCG TTC GAG CAA GGC CTC GCC GAC ACC GTG CGC TGG TAC GCC GAG 

PRVSFEQGLADTVRWYAE 
PVCRS SKASPTPCAGTPR 
PCVVRARPRRHRALVRRE 

RSQHSGNFSRASDSPMAR 
GPSTPATSRARATRRCPE 
VPVPPLRQVLARQGVAHS 

TTG GCC CTG ACC ACC CTC GGC AAC TTG CTC GCG CGC GAC AGG CTG CCG TAC CGA 
23769 23778 23787 23796 23805 23814 

AAC CGG GAC TGG TGG GAG CCG TTG AAC GAG CGC GCG CTG TCC GAC GGC ATG GCT 

NRDWWEPLNERALSDGMA 
TGTGGSR*TSARCPTAWL 
PGLVGAVERARAVRRHGS 

ATGVAGMVLPSGARP S GR 
PRASLVWS *PLARGRAE G 
QGHRCCGHSPSLGGAPKG 



GAC CGG CAC GGC TGT CGT GGG TAC TGA TCC CCT CTC GGG CGG GCG CCC GAA GGG 
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23823- 23832 23841 23850 23859 23868 

CTG GCC GTG CCG ACA GCA CCC ATG ACT AGG GGA GAG CCC GCC CGC GGG CTT CCC 



LAVPTAPMTRGEPARGLP 
WPCRQHP*LGESPPAGFP 
GRAD STHD*GRARPRASP 

RQGFEKNRTTKWIKWS IQ 
ESVSNKTERQKGSKGPSK 
KASRIRQKANNELNELLN 

GAA GCG ACT GGC TTA AGA AAC AAA GCG CAA CAA AAG GTC TAA AAG GTC CTC TAA 
23877 23886 23895 23904 23913 23922 

CTT CGC TGA CCG AAT TCT TTG TTT CGC GTT GTT TTC CAG ATT TTC CAG GAG ATT 

LR*PNSLFRVVFQIFQEI 
FADR I L CFALFSRF SRRF 
SLTEFFVSRCFPDFPGDL 

HRVTQHGASGAE DARMHR 
IAC QRTVPPAPKMPECTA 
SPASDPSRRLRS*RSAHP 

ACT ACC GCG TGA CAG ACC ACT GGC CGC CTC GGC CGA AGT AGC CGA GCG TAC ACC 
23931 23940 23949 23958 23967 23976 

tga tgg cgc act gtc tgg tga ccg gcg gag ccg gct tca tcg gct cgc atg tgg 

*wrtvw*paepassarmw 
dgal sgdr rsrlhrlacg 
(m) ahclvtggagf igshva 

lsqeaapvpyrdevveaa 
sarslrpcrtdtrssrlp 
ppea*gragpipgrrg*r 

gcc tcc gag acg agt cgg cgc ccg tgg ccc ata gcc agg agc tgc tgg agt cgc 

23985 23994 24003 24012 24021 24030 

CGG AGG CTC TGC TCA GCC GCG GGC ACC GGG TAT CGG TCC TCG ACG ACC TCA GCG 

RRLCSAAGTGYRSST TSA 
GGSAQPRAPGIGPRRPQR 
EALL SRGHRVSVLDDLSG 

AGGLTDGLARVQEGPRHG 
PVASRTGSPACRNVPDTV 
RCRRAHGRPRAGT *RTP S 

CGC CGT GGC GGC TCG CAC AGG GGC TCC CGC GCG TGG ACA AGT GGC CCA GCC ACT 
24039 24048 24057 24066 24075 24084 

GCG GCA CCG CCG AGC GTG TCC CCG AGG GCG CGC ACC TGT TCA CCG GGT CGG TGA 
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GGC TAC ACC TCG ACC AGC TGT CCG AGA AGC GGC TCG TCG CTA AGC TGG TGC AGA 
24093 24102 24111 24120 24129 24138 

CCG ATG TGG AGC TGG TCG ACA GGC TCT TCG CCG AGC AGC GAT TCG ACC ACG TCT 

PMWSWSTGSSPSSDSTTS 
RCGAGRQALRRAA I RPR L 

DVELVDRLFAEQRFDHVF 

VERRERRLRDTVRHLAEV 
WKAANAASAIL*ETFLRL 
GSRPTRPPPS*DSPSSG* 

AGG TGA AGC GCC GCA AGC GCC GCC TCC GCT AGT CAG TGA GCC ACT TCT CGG AGT 
24147 24156 24165 24174 24183 24192 

TCC ACT TCG CGG CGT TCG CGG CGG AGG CGA TCA GTC ACT CGG TGA AGA GCC TCA 

STSRRSRRRRSVTR * R A S 
PLRGVRGGGDQSLGE EPQ 
HFAAFAAEAISHSVKSLN 

VAGVHHAAHVE DVRRQ S G 
*PVLTIPLTFRMLAASRV 
SRCWRSPCRSG**RPA AF 

TGA TGC CGT GGT TGC ACT ACC CGT CGC ACT TGG AGT AGT TGC GCC GCG ACG CTT 
24201 24210 24219 24228 24237 24246 

ACT ACG GCA CCA ACG TGA TGG GCA GCG TGA ACC TCA TCA ACG CGG CGC TGC GAA 

TTAPT*WAA*TSSTRRCE 
LRHQRDGQREPHQRGAAN 
YGTNVMGSVNLINAALRT 

ADREETERGGDRHVPVAL 
PTENKQKADETATYP CP S 
RRRTRRNRTRRRPTRARR 

GGC CGC AGA GCA AGA AGA CAA AGC GCA GGA GGC AGC GCC ACA TGC CCG TGC CGC 
24255 24264 24273 24282 24291 24300 

CCG GCG TCT CGT TCT TCT GTT TCG CGT CCT CCG TCG CGG TGT ACG GGC ACG GCG 

PASRSSVSRPPSRCTGTA 
RRLVLLFRVLRRGVRARR 
GVSFFCFASSVAVYGHGE 

GRHPLRRDRYRGVTVAVR 
VGIRSDD IGTGASL*PLA 
SGSAPTTSGPVPRCNRC R 

TCT GGG GCT ACG CCC TCA GCA GCT AGG GCC ATG GCC GGC TGT CAA TGC CGT TGC 
24309 24318 24327 24336 24345 24354 

AGA CCC CGA TGC GGG AGT CGT CGA TCC CGG TAC CGG CCG ACA GTT ACG GCA ACG 

RPRCGSRRSRYRPTVTAT 
DP DAGVVDPGTGRQLRQR 
TPMRESS IPVPADSYGNA 
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FERDLALQFRRHPGLAQG 
FSVTSRSSSVVIRVWPRG 
SV*PRARAPFSSASGPGA 

GCT TTG AGT GCC AGC TCG CGC TCG ACC TTT GCT GCT ACG CCT GGG TCC CGG ACG 
24363 24372 24381 24390 24399 24408 

CGA AAC TCA CGG TCG AGC GCG AGC TGG AAA CGA CGA TGC GGA CCC AGG GCC TGC 

RNSRSSASWKRRCGPRAC 
ETHGRARAGNDDADPGPA 
KLTVERELETTMRTQGLP 

EGCETHVVHVAFPLVHAV 
KVANRICLTYPSHCFMRS 
R*RMGYACRTRRI ASCAR 

GGA AGT GGC GTA AGG CAT ACG TGT TGC ACA TGC CGC TTA CCG TCT TGT ACG CGC 
24417 24426 24435 24444 24453 24462 

CCT TCA CCG CAT TCC GTA TGC ACA ACG TGT ACG GCG AAT GGC AGA ACA TGC GCG 

PSPHSVCTTCTANGRTCA 
LHR I PYAQRVRRMAE HAR 
FTAFRMHNVYGEWQNMRD 

GIAIRDGNEEVLDQATLR 
G*RLATAMKKLWI RRP S G 
GRDCHPRWKR*GS GARHA 

TGG GGA TAG CGT TAC GCC AGC GGT AAA AGA AGT TGG TCT AGG ACG CGC CAC TCG 
24471 24480 24489 24498 24507 24516 

ACC CCT ATC GCA ATG CGG TCG CCA TTT TCT TCA ACC AGA TCC TGC GCG GTG AGC 

TPIAMRSPFSSTRSCAVS 
PLSQCGRHFLQPDPAR*A 
PYRNAVAIFFNQILRGEP 

DRDVAVATLHPREAVD LV 
IE T*PSPP*TRANL*TLS 
SRPRRRRRDPAPT*SR*P 

GCT AGA GCC AGA TGC CGC TGC CGC CAG TCC ACG CCC GCA AGT CGA TGC AGT TCC 
24525 24534 24543 24552 24561 24570 

CGA TCT CGG TCT ACG GCG ACG GCG GTC AGG TGC GGG CGT TCA GCT ACG TCA AGG 

RSRSTATAVRCGRSATSR 
DLGLRRRRSGAGVQLRQG 
I SVYGDGGQVRAFSYVKD 

DHVDDHAGGLRLLGPAPG 
MTSTMTRAGSVSFAQPRA 
CRPR*RARGRSPSPRPGP 



TGT AGC ACC TGC AGT AGC ACG CGC GGG 
24579 24588 24597 

ACA TCG TQG ACG TCA TCG TGC GCG CCC 



GGC TCT GCC TCT TCC GGA CCC CGG CCC 
24606 24615 24624 

CCG AGA CGG AGA AGG CCT GGG GCC GGG 
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T S W T S S C A " P P R R R R PGA G 
HRGRHRARPRDGEGLGPG 
IVDV I VRAPETEKAWGRA 

EVDARGAGVGHQLQGLGH 
KLTPEDRVLVTSSSAWAT 
R*RRSTGCWCRAPAPGPR 

GGA AGT TGC AGC CGA GCA GGG CGT GGT TGT GGC ACG ACC TCG ACC GGG TCC GGC 
24633 24642 24651 24660 24669 24678 

CCT TCA ACG TCG GCT CGT CCC GCA CCA ACA CCG TGC TGG AGC TGG CCC AGG CCG 

PSTSARPAPTPCWSWPRP 
LQRRLVPHQHRAGAGPGR 
FNVGSSRTNTVLELAQAV 

TRRGTDGAVGDRVQGGPV 
RAAAPTGLWGMACRGARS 
AHPPRHGWGGWRAGARGP 

ACG CAC GCC GCC GGC CAC AGG GGT CGG TGG GGT AGC GCG TGG ACG GGC GGG CCC 
24687 24696 24705 24714 24723 24732 

TGC GTG CGG CGG CCG GTG TCC CCA GCC ACC CCA TCG CGC ACC TGC CCG CCC GGG 

CVRRPVSPATPSRTCPPG 
ACGGRCPQP PHRAPARPG 
RAAAGVPSHPIAHLPARD 

LHHD GVGGGLLGALDEAV 
STITA*VAVSSARSTKPS 
RPSPRRCRWRPPGRPRRR 

TGC TCC ACT ACC AGC GGA TGT GGC GGT GGC TCC TCC GGG CGC TCC AGA AGC CGC 
24741 24750 24759 24768 24777 24786 

ACG AGG TGA TGG TCG CCT ACA CCG CCA CCG AGG AGG CCC GCG AGG TCT TCG GCG 

TR*WSPTPPPRRPARS SA 
RGDGRLHRHRGGPRGLRR 
EVMVAYTATEEAREVFGD 

PRVGRQRVPEGPGGRPGG 
QASVGSASPSARVAAHAA 
SPPCGA PPRARGSRRTPR 

TGA CCC GCC TGT GGG GCG ACC GCC TGC CCG AGC GGG CCT GGC GGC GCA CCC GGC 
24795 24804 24813 24822 24831 24840 

ACT GGG CGG ACA CCC CGC TGG CGG ACG GGC TCG CCC GGA CCG CCG CGT GGG CCG 

TGRTPRWRTGSPGPPRGP 
LGGHPAGGRARPDRRVGR 
WADT PLADGLARTAAWAA 

GDAGGFQAGGELDLDASL 
ETPGASSREEKS I SIPPS 
RRRGRRVASRRRSRSRRL 



GGA GGC AGC CGG GGC GGC TTG ACG CGA GGA GGA AGC TCT AGC TCT AGC CGC CTC 
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24849 24858 24867 24876 24885 24894 

CCT CCG TCG GCC CCG CCG AAC TGC GCT CCT CCT TCG AGA TCG AGA TCG GCG GAG 



PPSAPPNCAPPSRSRSAE 
LRRPRRTALLLRDRDRRR 

SVGPAELRSSFEIEIGGE 

ADRLPRLTHGVPQAAGVP 
RTGSHACHTASRSLPASR 
ARGPTPATHPRGASRRRG 

TCG CGC AGG GCC TCA CCC GCG TCA CAC ACC GGC TGG CCG ACT CGC CGC GGC TGG 
24903 24912 24921 24930 24939 24948 

AGC GCG TCC CGG AGT GGG CGC AGT GTG TGG CCG ACC GGC TGA GCG GCG CCG ACC 

SASRSGRSVWPTG*AAPT 
ARPGVGAVCGRPAERRRP 

RVPEWAQCVA DRLSGADR 

SGWGLGDRKSACRVTSTL 
HDG AWATESPLAGSLPPL 
TIG LGLRRAQFRVQCHLY 

CCA CTA GGG GTC GGG TTC GGC AGA GCG AAC CTT CGC GTG GAC TGT CAC CTC CAT 
24957 24966 24975 24984 24993 25002 

GGT GAT CCC CAG CCC AAG CCG TCT CGC TTG GAA GCG CAC CTG ACA GTG GAG GTA 

GDPQPKP SRLEAHLTVEV 
VIPSPSRLAWKRT*QWR* 
*SPAQAVSLGSAPDSGGK 

CCHVIKLNPTPYTFELRP 
AVTFSRS IRRRTRS S S GH 
PLLSRDQSEADPVHVRAT 



TCC GTT GTC ACT TGC TAG AAC TCT AAG 
25011 25020 25029 

AGG CAA CAG TGA ACG ATC TTG AGA TTC 



CCG CAG CCC ATG CAC TTG AGC TCG GCA 
25038 25047 25056 

GGC GTC GGG TAC GTG AAC TCG AGC CGT 




CCC ACT TGC TGA AAC ACA TGT TGC CCC AGG CCA TGC GGT GGC GGA GGT GCG CGC 
25065 25074 25083 25092 25101 25110 

GGG TGA ACG ACT TTG TGT ACA ACG GGG TCC GGT ACG CCA CCG CCT CCA CGC GCG 

G*TTLCTTGSGTPPPPRA 
GERL CVQRGPVRHR LHAR 
VNDFVYNGVRYATASTRD 

V Q ,v.Q ALRGLLPGVREERRE 
* R S L W G GWSRASANKAAN 
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TGA TGG ACG ACT CGG TCG GCG GGG TCC TCG CCC GGC TGC GCA AGA AGC GCC GCA 
25119 25128 25137 25146 25155 25164 

ACT ACC TGC TGA GCC AGC CGC CCC AGG AGC GGG CCG ACG CGT TCT TCG CGG CGT 

TTC*ASRPRSGPTRSSRR 
LPAEPAAPGAGRRVLRGV 
YLLSQPPQERADAFFAAF 

RPGLADQLEARQLARVGQ 
GPALRTRSSPASSPASVR 
GPPWARGPARRAPPRp CG 

AGG GCC CCC GGT TCG CGC AGG ACC TCG AGC CGC GCG ACC TCC CGC GCC TGT GGG 
25173 25182 25191 25200 25209 25218 

TCC CGG GGG CCA AGC GCG TCC TGG AGC TCG GCG CGC TGG AGG GCG CGG ACA CCC 

SRGPSASWSSARWRARTP 
PGGQARPGARRAGGRGHP 
PGAKRVLELGALEGADTL 

RHRSLGADLDEGQLAAFL 
AIDPCGPTSIRARSPRSS 
PS TPVARRRSGRGPPGRL 

ACC GCT ACA GCC CTG TCG GGC CGC AGC TCT AGG AGC GGG ACC TCC CGG CGC TTC 
25227 25236 25245 25254 25263 25272 

TGG CGA TGT CGG GAC AGC CCG GCG TCG AGA TCC TCG CCC TGG AGG GCC GCG AAG 

WRCRDSPASRSSPWRAAK 
GDV-GTARRRDPRPGGPRR 
AMSGQPGVEILALEGREE 

VQAAGLEDHLHVADGVHF 
FRRRASNTMSTCPTVL T S 
SGAGRRTR*PPARR*WRP 

TCT TGG ACG CGG CGC GGC TCA AGC AGT ACC TCC ACG TGC CGC AGT GGT TGC ACC 
25281 25290 25299 25308 25317 25326 

AGA ACC TGC GCC GCG CCG AGT TCG TCA TGG AGG TGC ACG GCG TCA CCA ACG TGG 

RTCAAPSSSWRCTASPTW 
EPA.PRRVRHGGARRHQRG 
NLRRAE FVMEVHGVTNVE 

EPEGVHLRHLEGPEAVEV 
SRSA STSDISNAPSPWKS 
VGARRRPTSPTRRARGSR 

TTG AGG CCG AGC GGC TGC ACC TCA GCT ACC TCA AGC GGC CCG AGC CGG TGA AGC 
25335 25344 25353 25362 25371 25380 

AAC TCC GGC TCG CCG ACG TGG AGT CGA TGG AGT TCG CCG GGC TCG GCC ACT TCG 

NSGSPTWSRWSSPGSATS 
TP ARRRGVDGV.RRARp LR 

LR LADVESMEFAGLGHFD 
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GREACPEEVVHLPGPLQE 
AVSQAPSR*WTCRGQS S S 
RWARRLAGRGRAAARPAA 

TGC GGT GCG AGA CGC GTC CCG AGG AGA TGG TGC ACG TCG CCG GGA CCC TCG ACG 
25389 25398 25407 25416 25425 25434 

ACG CCA CGC TCT GCG CAG GGC TCC TCT ACC ACG TGC AGC GGC CCT GGG AGC TGC 

TPRSA QGSSTTCSGPGSC 
RHALRRAP LPRAAALGAA 
ATLCAGLLYHVQRPWELL 

GVDA GDGVAEVEGGVVP A 
A S M P ETESQR*REVW*QP 
RRCRSRRRSGRGRWGS SP 

AGC GGC TGT AGC CGA GGC AGA GGC TGA CGG AGA TGG AGA GGT GGG TGA TGA CCC 
25443 25452 25461 25470 25479 25488 

TCG CCG ACA TCG GCT CCG TCT CCG ACT GCC TCT ACC TCT CCA CCC ACT ACT GGG 

SPTSAPSPTASTSPPTTG 
RRHRLRLRLPLPLHPLLG 
ADI GSVSDCLYLSTHYWG 

A R V S H GVEVTR P GGR GR L 
LESPIVSRSPVRDVGDAF 
CSPRFSRGRRYATWGTRS 

CGT CGA GCC TGC CTT ACT GGC TGG AGC TGC CAT GCG CCA GGT GGG GCA GGC GCT 
25497 25506 25515 25524 25533 25542 

GCA GCT CGG ACG GAA TGA CCG ACC TCG ACG GTA CGC GGT CCA CCC CGT CCG CGA 

AARTE* PTSTVRGPPRPR 
Q L GR ND R P RRYAVH P V R E 
SSDGMTDLDGTRSTP SAK 

GGRAGPGRG*RRRASAPG 
VVGL GLGAAEADVHAP QV 
SWGS GWARPRLT S TRQ S S 

TCT GGT GGG GCT CGG GGT CCG GGC GCC GGA GTC GCA GCT GCA CGC GAC CGA CCT 
25551 25560 25569 25578 25587 25596 

AGA CCA CCC CGA GCC CCA GGC CCG CGG CCT CAG CGT CGA CGT GCG CTG GCT GGA 

RPPRAPGPRPQRRRALAG 
DHPE PQARGLSVDVRWLD 
TTP SPRPAASASTCAGWT 

ATASARGPAPPS *RHRPA 
PRRQHAGQLLRAEGI DLH 
RGDS IRARSCAPKVST ST 

GGC CGG CAG CGA CTA CGC GCG GGA CCT CGT CCG CCC GAA GTG GCT ACA GCT CCA 
25605 25614 25623 25632 25641 25650 

CCG GCC GTC GCT GAT GCG CGC CCT GGA GCA GGC GGG CTT CAC CGA TGT CGA GGT 
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P* A V A D A R P' G A G G L H R" C R G 
RPSLMRALEQAGFTDVEV 
GRR* CAPWSRRASPMSRC 

ARAPWPLPRRCRRPRGCP 
QVLPGRCLDAVDDRGAAL 
SCSRAVASTQSMTAAQRL 

CGA CGT GCT CGC CCG GTG CCG TCT CCA GAC GCT GTA GCA GCG CCG GAC GGC GTT 
25659 25668 25677 25686 25695 25704 

GCT GCA CGA GCG GGC CAC GGC AGA GGT CTG CGA CAT CGT CGC GGC CTG CCG CAA 

AARAGHGRGLRHRRGLPQ 
LHERATAEVCDIVAACRK 
CTSGPRQRSATSSRPAAR 

RRAGSTVSGPRP SLLVC G 
GAHGARSAARVLRFS SAD 
APTGREHRQGSSAFPPRM 

CCG GCC GCA CGG GGC GAG CAC TGC GAC GGG CCT GCT CCG CTT TCC TCC TGC GTA 
25713 25722 25731 25740 25749 25758 

GGC CGG CGT GCC CCG CTC GTG ACG CTG CCC GGA CGA GGC GAA AGG AGG ACG CAT 

GRRAPLVTLPGRGERRTH 
A GVPRS *RCPDEAKGGR I 
PACPARDAARTRRKEDAS 

HGRRCQVPGRRDLPE SPV 
MVVAVS SRAAAI SRNRR S 
WSWPSVPGPRPSRATGVP 

GGT ACT GGT GCC GCT GTG ACC TGG CCC GGC GCC GCT AGC TCG CCA AGG CTG CCC 
25767 25776 25785 25794 25803 25812 

CCA TGA CCA CGG CGA CAC TGG ACC GGG CCG CGG CGA TCG AGC GGT TCC GAC GGG 

P*PRRHWTGPRRSSGSDG 
Jl DHGDTGPGRGDRAVPT G 

(m) ttatldraaai ERFRRD 

^ "=> 

AERVRARNEGRVRDGTE L 
PKAFAPGTRAGSAIARRL 
RSRSRPGPERGPRSRGD * 

TGC CGA AGC GCT TGC GCC CGG GCC AAG AGC GGG GCC TGC GCT AGC GGG CAG AGT 
25821 25830 25839 25848 25857 25866 

ACG GCT TCG CGA ACG CGG GCC CGG TTC TCG CCC CGG ACG CGA TCG CCC GTC TCA 

TASRTRARFSPRTRSPVS 
RLRERGPGSRPGRDRPSQ 
GFANAGPVLAPDAIARLK 

RAGFPEDGAEGVLAQAGV 
APASRSMVRKVS SPRRE S 
PPRRVA**GS*RRPGASR 



TCC GCC CGC GGC TTG CCG AGT AGT GGG CGA AGT GGC TGC TCC CGG ACG CGA GGC 
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258-75 25884 ' 25893 25902 25911 25920 

AGG CGG GCG CCG AAC GGC TCA TCA CCC GCT TCA CCG ACG AGG GCC TGC GCT CCG 



RRAPNGS SPASPTRACAP 
GGRRTAHHPLHRRGPALR 
AGAERLITRFTDEGLRSD 

VVPVEGDLAILTGDEVAH 
S*QFKGTSPSSRGTR*rt 
RSSS SGRRPRHADRGRGR 

TGC TGA TGA CCT TGA AGG GGC AGC TCC CGC TAC TCG CAG GGC AGG AGA TGG CGC 
25929 25938 25947 25956 25965 25974 

ACG ACT ACT GGA ACT TCC CCG TCG AGG GCG ATG AGC GTC CCG TCC TCT ACC GCG 

TTTGTSPSRAMSVPS STA 
RLLELPRRGR*ASRPLPR 
DYWNFPVEGDERPVLYRV 

VVQLLLVPGRFPVQQVAL 
C LKSFCSQAGSRSRSCRS 
ACSPSAPSPGPVPGAAGR 

ACG TGT TGA ACC TCT TCG TCC TGA CCC GGG GCC TTG CCC TGG ACG ACG TGG CGC 
25983 25992 26001 26010 26019 26028 

TGC ACA ACT TGG AGA AGC AGG ACT GGG CCC CGG AAC GGG ACC TGC TGC ACC GCG 

CTTWRSRTGPRNGTCCTA 
AQLGEAGLGPGTGPAAPR 
H NLEKQDWAPERDLLHRE 

FQRLEGGREHVARDHGGG 
SSACSAAANTSPGTTGVA 
PVPAARRRTRPRGPRAWR 

TCC TTG ACC GCG TCG AGC GGC GGC GCA AGC ACC TGC CGG GCC AGC ACG GGT GGC 
26037 26046 26055 26064 26073 26082 

AGG AAC TGG CGC AGC TCG CCG CCG CGT TCG TGG ACG GCC CGG TCG TGC CCA CCG 

RNWR S S P PR SWTAR S C P P 
GTGAARRRVRGRPGRAHR 
ELAQLAAAFVDGPVVPTA 

VREDELLRVP-GRLHWPVT 
* A S T R L SGYRAASTGHCR 
RRARG* PATGPRPPAMAG 

GGA TGC GCG AGC AGG AGT TCC TCG GCA TGG CCC GGC GCC TCC ACG GTA CCG TGG 
26091 26100 26109 26118 26127 26136 

CCT ACG CGC TCG TCC TCA AGG AGC CGT ACC GGG CCG CGG AGG TGC CAT GGC ACC 

PTRS SSRSRTGPRRCHGT 
LRARPQGAVPGRGGAMAP 
YALVLKEPYRAAEVPWHR 

V A ,JD VDARARDAI QADAQV 
SRTLTPGRVTQLRLMQRS 
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CAC TGG CGC AGT TGC AGC CGG GCG CGT GCC AGA CGT TAG ACT CGT AGA CGG ACC 
26145 26154 26163 26172 26181 26190 

GTG ACC GCG TCA ACG TCG GCC CGC GCA CGG TCT GCA ATC TGA GCA TCT GCC TGG 

VTASTSARARSAI * A S A W 
*PRQRRPAHGLQSEHLPG 
DRVNVGPRTVCNLS I CLD 

VG .SRVVSAQLRNRSRVQE 
SAPGCLPHRSATGPDCRS 
RRRVACRIGPPPEPIAGA 

TGC TGC GGC CTG GCG TGT TGC CTA CGG ACC TCC GCC AAG GCC CTA GCG TGG ACG 
26199 26208 26217 26226 26235 26244 

ACG ACG CCG GAC CGC ACA ACG GAT GCC TGG AGG CGG TTC CGG GAT CGC ACC TGC 

TTPDRTTDAWRRFRDRTC 
RRRTAQRMPGGGSGIAPA 
DAGPHNGCLEAVPGSHLL 

GVVGLHRLHARGSGHNRD 
GSSASTAFTRAVPGTTGT 
GRRRRPPSPARSRVRPEP 

AGG GGC TGC TGC GGC TCC ACC GCT TCC ACG CGC GCT GGC CTG GGC ACC AAG GCC 
26253 26262 26271 26280 26289 26298 

TCC CCG ACG ACG CCG AGG TGG CGA AGG TGC GCG CGA CCG GAC CCG TGG TTC CGG 

SP TTPRWRRCARPDPWFR 
PRRRRGGEGARDRTRGS G 
PDDAEVAKVRATGPVVPV 

RDALAVHHHVVDPE DVTR 
GTLWPSTTT CSTRSTWPE 
GP *GPRRPPARRGARGRN 

AGG GCC AGT CGG TCC CGC TGC ACC ACC ACG TGC TGC AGG CCG AGC AGG TGC CAA 
26307 26316 26325 26334 26343 26352 

TCC CGG TCA GCC AGG GCG ACG TGG TGG TGC ACG ACG TCC GGC TCG TCC ACG GTT 

SRSARATWWCTTSGSSTV 
PGQPGRRGGARRPARPRF 
PVSQGDVVVHDVRLVHGS 

ARVGVATPPPGDDDLVGV 
PGFALPLQRRVMTMSYAS 
PGSRWRCNAASWR *RTRR 

GCC CGG GCT TGC GGT TGC CGT CAA CCG CCG CCT GGT AGC AGT AGC TCA TGC GGC 
26361 26370 26379 26388 26397 26406 

CGG GCC CGA ACG CCA ACG GCA GTT GGC GGC GGA CCA TCG TCA TCG AGT ACG CCG 

RARTPTAVGGGPSSS STP 
GP.ERQRQLAADHRHRVRR 
GPNANGSWRRTIVI EYAD 
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RGCRRRGSRQAASRWASM 
GAAGGAGQASRRRAGPLC 
GPRVAPARLAAGGLALCV 



TGG GCC GGC GTG GCG GCC GCG GGA CTC GCG ACG CGG CGG CTC GCG GTC CGT CTG 
26415 26424 26433 26442 26451 26460 

ACC CGG CCG CAC CGC CGG CGC CCT GAG CGC TGC GCC GCC GAG CGC CAG GCA GAC 

TRPHRRRPERCAAERQAD 
PGRTAGALSAAPPSARQT 
PAAPPAP *ALRRRAP GRH 

SRCTLSDKPHPNHEGGRV 
RVAP*PTKRILI INVAEF 

DFPLDPLRESSS*T*RRS 

TAG CTT GCC GTC CAG TCC CTC AGA AAG CCT ACT CCT AAT ACA AGT GGC GGA GCT 
26469 26478 26487 26496 26505 26514 

ATC GAA CGG CAG GTC AGG GAG TCT TTC GGA TGA GGA TTA TGT TCA CCG CCT CGA 



IERQVRESFG*GLCSPPR 
SNGRSGSLS E D Y V H R L E 

RTAGQGVFR (mJ) R I M F T A S N /~-t 



PRSMVHAHHGQGPRQAGR 
QAPC*MHMTGRAQASRAA 
SPPVNCTCPAGPRPAARR 

TGA CCC GCC CTG TAA TGT ACA CGT ACC ACG GGG ACC GGA CCC GCG ACG CGC GGC 
26523 26532 26541 26550 26559 26568 

ACT GGG CGG GAC ATT ACA TGT GCA TGG TGC CCC TGG CCT GGG CGC TGC GCG CCG 

TGRDITCAWCPWPGRCAP 
LGGTLHVH GAPGL GAARR 
WAGHYMCMVPLAWALRAA 

SVLDPHRARRRLFAPDGR 
PCSIRTAHGGDCSRPTAA 
PVRSGPPTGATAPVRPRR 

GCC CTG TGC TCT AGG CCC ACC GCA CGG GCG GCA GCG TCC TTG CGC CCC AGC GGC 
26577 26586 26595 26604 26613 26622 

CGG GAC ACG AGA TCC GGG TGG CGT GCC CGC CGT CGC AGG AAC GCG GGG TCG CCG 




GCT GGC CGG ACT ACG GCC AGG GCC ACG AGC TGC GCG GCC TGT ACT ACC TTT CGC 
26631 26640 26649 26658 26667 26676 

CGA CCG GQC TGA TGC CGG TCC CGG TGC TCG ACG CGC CGG ACA TGA TGG AAA GCG 
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R P A *•■ C R S R' C S^"- T" R R T ■ *~* W K A 
DRPDAGPGARRAGHDGKR 
TGLMPVPVLDAPDMME SA 

PQRE IHLGHVCRRLGTRP 
RSAN*TCAMYVGGCDPGR 
GAPTRHAPWTCVAATRDA 

GGG CCG ACC GCA AGA TAC ACG TCC GGT ACA TGT GTG GCG GCG TCA GGC CAG GCG 
26685 26694 26703 26712 26721 26730 

CCC GGC TGG CGT TCT ATG TGC AGG CCA TGT ACA CAC CGC CGC AGT CCG GTC CGC 

PGWRSMCRPCTHRRSPVR 
PAGVLCAGHVHTAAVRSA 
RLAFYVQAMYTPPQ SGPR 

RQRQVREGPLRHLREVVE 
GSGSCGNVPCGICDSLSK 
AAAAAGT*RAASATA*RS 

CCG GCG ACG GCG ACG TGG GCA AGT GGC CCG TCG GCT ACG TCA GCG AGT TGC TGA 
26739 26748 26757 26766 26775 26784 

GGC CGC TGC CGC TGC ACC CGT TCA CCG GGC AGC CGA TGC AGT CGC TCA ACG ACT 

GRCRCTRSPGSRCSRSTT 
AAAAAPVHRAADAVAQRL 
PLPLHPFTGQPMQSLNDF 

VGAVQAVEPLLRDVRHLA 
SAPSRRSKQFFDI SATCR 
RRRRGARSRSSTSRRPAA 

AGC TGC GGC CGC TGG ACG CGC TGA AGA CCT TCT TCA GCT AGC TGC GCC ACG TCG 
26793 26802 26811 26820 26829 26838 

TCG ACG CCG GCG ACC TGC GCG ACT TCT GGA AGA AGT CGA TCG ACG CGG TGC AGC 

STPATCATSGRSRSTRCS 
RRRRPARLLEEVDRRGAA 
DAG DLRDFWKKSIDAVQR 

AIVVRHAEAVVPPGVQHH 
L*SLATLKPSWQRGSRTT 
CSHCRPSSRRGSAARGPP 

CGT CGA TAC TGT TGC GCC ACT CGA AGC CGC TGG TGA CCG CCG GGC TGG ACC ACC 
26847 26856 26865 26874 26883 26892 

GCA GCT ATG ACA ACG CGG TGA GCT TCG GCG ACC ACT GGC GGC CCG ACC TGG TGG 

AAMTTR*ASATTGGPTWW 
QL*QRGELRRPLAARPGG 
SYDNAVSFGDHWRPD LVV 

VVDHGDLACQDGREPAHR 
CSMMATSPASTAASRPTG 
ARC* PRRPRVPRRAGPRA 



ACG TGC TGT AGT ACC GGC AGC TCC CGC GTG ACC AGC GGC GCG AGG CCC CGC ACG 
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26901 269T0 * 269T9' 26928 26937 26946 

TGC ACG ACA TCA TGG CCG TCG AGG GCG CAC TGG TCG CCG CGC TCC GGG GCG TGC 



CTTSWPSRAHWSPRSGAC 
ARHHGRRGRTGRRAPGRA 
HDIMAVEGALVAALRGVP 

ADIHRGPEDAGHLGLRPE 
LT*TDGPNMPVTSVSGPS 
SRRHTART*RCRP SRAPA 

GCT CGC AGA TAC ACA GCG GGC CCA AGT AGC CGT GGC ACC TCT GGC TCG GCC CCG 
26955 26964 26973 26982 26991 27000 

CGA GCG TCT ATG TGT CGC CCG GGT TCA TCG GCA CCG TGG AGA CCG AGC CGG GGC 

RASMCRPGSSAPWRPSRG 
ERLCVARVHRHRGDRAGA 
SVYVSPGFIGTVETEPGL 

VQDRRVRQRAELLVADLP 
SRTEASGSDHKSFYPTSH 
RGPRPPGATTSRSTRRRT 

AGC TGG ACC AGA GCC GCC TGG GCG ACA GCA CGA AGC TCT TCA TGC CGC AGC TCA 
27009 27018 27027 27036 27045 27054 

TCG ACC TGG TCT CGG CGG ACC CGC TGT CGT GCT TCG AGA AGT ACG GCG TCG AGT 

STWSRRTRC RASRSTASS 
RPGLGGPAVVLREVRRRV 
DLVSADPLSCFEKYGVEW 

AAVPDLVRHVG*RVHRHR 
PRSRIWYATSGEGSTATG 
PGRGSGTRPPGRVPRPPA 

CCC CGG CGC TGG CCT AGG TCA TGC GCC ACC TGG GGA GTG GCC TGC ACC GCC ACG 
27063 27072 27081 27090 27099 27108 

GGG GCC GCG ACC GGA TCC AGT ACG CGG TGG ACC CCT CAC CGG ACG TGG CGG TGC 

GAATGS STRWTPHRTWRC 
GPRPDPVRGGPLT GRGGA 
GRDRIQYAVDPSPDVAVP 

RQAVRQPQGHAVHGVVAG 
GSPSASRSG MR*TG*LPA 
AAPRRAAAAWASRARCRR 

GCG GCG ACC CGC TGC GCG ACG CCG ACG GGT ACG CGA TGC ACG GGA TGT TGC CGC 
27117 27126 27135 27144 27153 27162 

CGC CGC TGG GCG ACG CGC TGC GGC TGC CCA TGC GCT ACG TGC CCT ACA ACG GCG 

RRWATRCGCPCATCPTTA 
AAGRRAAAAHALRALQRR 
PLGDALRLPMRYVPYNGA 

LA.JRVRPLQPRDPASAHAD 
WPASG HCSPGIRPLRTHM 
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GGG TCC CGC GCC TGG GCA CCG TCG ACC CCG GCT AGG CCC CGT CTG CGC ACA CGT 
27171 27180 27189 27198 27207 27216 

CCC AGG GCG CGG ACC CGT GGC AGC TGG GGC CGA TCC GGG GCA GAC GCG TGT GCA 

PRARTRGSWGRSGADACA 
PGRGPVAAGADPGQTRVH 
QGADPWQLGPIRGRRVCI 

DPAVRGRADEAGVYRRQp 
TQPLEAEPMKPASTGASR 
RRPCSPRPCRRRRRVPAA 

AGC AGA CCC CGT TGA GCC GGA GCC CGT AGA AGC CGC GGC TGC ATG GCC GCG ACG 
27225 27234 27243 27252 27261 27270 

TCG TCT GGG GCA ACT CGG CCT CGG GCA TCT TCG GCG CCG ACG TAC CGG CGC TGC 

SSGAT RPRASSAPTYRRC 
RLGQLGLGHLRRRRTGAA 
VWGNSASGIFGAD VPALR 

VGDVRRHPLARLHHERRR 
CAMSAATRCPASTTSVAG 
ARWRRPPAAPRPPPA*PA 

CCG TGC GGT AGC TGC GCC GCC ACG CCG TCC CGC GCC TCC ACC ACG AGT GCC GCG 
27279 27288 27297 27306 27315 27324 

GGC ACG CCA TCG ACG CGG CGG TGC GGC AGG GCG CGG AGG TGG TGC TCA CGG CGC 

GTPSTRRCGRARRWC SRR 
ARHRRGGAAGRGGGAHGA 
HAI DAAVRQGAEVVL TAP 

LFLHLLQSRQRGADPHQA 
CSCTSSSPASG.APTRTSR 
APVPPPAPLAAPRRGPAA 

GCG TCC TTG TCC ACC TCC TCG ACC CTC GCG ACG GCC GGC CGC AGG CCC ACG ACG 
27333 27342 27351 27360 27369 27378 

CGC AGG AAC AGG TGG AGG AGC TGG GAG CGC TGC CGG CCG GCG TCC GGG TGC TGC 

RRNRWR SWERCRPAS GCC 
AGTGGGAGSAAGRRP GAA 
QEQVEELGALPAGVRVLR 

VARQLEDERVAVQQHVVA 
LQGSSSMRGYQSRSTCWP 
CSGAPA*GGTSRGAPAGR 

CGT TGA CGG GCG ACC TCG AGT AGG AGG GCA TGA CGC TGG ACG ACC ACG TGG TGC 
27387 27396 27405 27414 27423 27432 

GCA ACT GCC CGC TGG AGC TCA TCC TCC CGT ACT GCG ACC TGC TGG TGC ACC ACG 

ATARWS SSSRTATCWCTT 
QL BAGAHPPVLRPAGAPR 
NCPLELI LPYCDLLVHHG 
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AGVAVHVADHRPNRLQGE 
LALQ*MFPMTAPIGCSDR 
CRWSSCSRCRPPSEAATG 

CGT CGC GGT TGA CGA TGT ACT TGC CGT AGC ACC GCC CCT AAG GCG TCG ACA GGG 
27441 27450 27459 27468 27477 27486 

GCA GCG CCA ACT GCT ACA TGA ACG GCA TCG TGG CGG GGA TTC CGC AGC TGT CCC 

AAPTAT * TASWRGFRS CP 
QRQLLHERHRGGDSAAVP 
SANCYMNGIVAGIPQLSL 

GEVVVRQDAAATD I GGAG 
A R L * S V S IQPRRI SGAPA 
RG*SRCA SRRGGYRDRRR 

AGC GGG AGT TGA TGC TGT GCG ACT AGA CGC CGG CGG CAT AGC TAG GGC GGC CGC 
27495 27504 27513 27522 27531 27540 

TCG CCC TCA ACT ACG ACA CGC TGA TCT GCG GCC GCC GTA TCG ATC CCG CCG GCG 

SPSTTTR*SAAAVSI PPA 
RPQLRHADLRPPYRSRRR 
ALNYDTLICGRRIDPAGA 

GQGQGAKLGRGLLDLLRQ 
VRVRDPR SAVASFT S SAS 
WGSGTRGQPWPRSPRPPA 

GGT GGG ACT GGG ACA GGC CGG AAC TCC GGT GCC GGC TCT TCC AGC TCC TCC GCG 
27549 27558 27567 27576 27585 27594 

CCA CCC TGA CCC TGT CCG GCC TTG AGG CCA CGG CCG AGA AGG TCG AGG AGG CGC 

PP*PCPALRPRPRRSRRR 
HPDPVRP *GHGREGRGGA 
TLTLSGLEATAEKVEEAL 

APHQEVVAVAPRRLFQPV 
RRTSNSWR*RRAASFSRS 
AGPATRGGSGGPPPSVAP 

ACG CGG CCC ACG ACA AGC TGG TGG CGA TGG CGG CCC GCC GCC TCT TTG ACG CCC 
27603 27612 27621 27630 27639 27648 

TGC GCC GGG TGC TGT TCG ACC ACC GCT ACC GCC GGG CGG CGG AGA AAC TGC GGG 

CAGCCSTTATAGRRRNCG 
APGAVRPPLPPGGGE TAG 
RRVLFDHRYRRAAE KLRD 

ADLPCRRGGRDGPQQGAE 
PT SRAGE GAATAP S SVRR 
RRRAPVKARRPRRAA S GG 



TGC CGC AGC TCG CCC GTG GAA GCG GGC 
27657 27666 27675 

ACG GCG TGG AGC GGG CAC CTT CGC CCG 



GGC GCC AGC GGC CCG ACG ACT GGG CGG 
27684 27693 27702 

CCG CGG TCG CCG GGC TGC TGA CCC GCC 
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T A S S G" H Ii R P P' R S P G CT * P A 
RRRAGTFARRGRRAADPP 
GVERAPSPAAVAGLLTRL 

HRVAPQRRLVDGLDHVVG 
TASP PSDAFSTASTT S LA 
RPPRRATPSPRRRPRPCR 

AGC ACC GCC TGC CGC CCG ACA GCC GCT TCC TGC AGC GGC TCC AGC ACC TGT TGC 
27711 27720 27729 27738 27747 27756 

TCG TGG CGG ACG GCG GGC TGT CGG CGA AGG ACG TCG CCG AGG TCG TGG ACA ACG 

SWRTAGCRRRTSPRSWT T 
RGGRRAVGEGRRRGRGQR 
VADGGLSAKDVAEVVDNA 



GLSPPARSLRASSPVAPR 
VSARLLAHCDPQLLSLPG 
WRPESSRTVIPSF FPCRA 

GGT GGC TCC GAG CCT CCT CGC GCA CTG TTA GCC CGA CTT CTT CCC TGT CGC CCG 
27765 27774 27783 27792 27801 27810 

CCA CCG AGG CTC GGA GGA GCG CGT GAC AAT CGG GCT GAA GAA GGG ACA GCG GGC 




GCA GCA GTG GCC CCC ACG GCC GAA GTA 
27819 27828 27837 

CGT CGT CAC CGG GGG TGC CGG CTT CAT 



GCC GAG GGT GGA CAC GCT TGC CGA GTA 
27846 27855 27864 

CGG CTC CCA CCT GTG CGA ACG GCT CAT 




GCT CGC CCC AGA CAG CCA CTG GAC GCA CCT GTT GGA CAG GTG GCC GTC CTA GCG 
27873 27882 27891 27900 27909 27918 

CGA GCG GGG TCT GTC GGT GAC CTG CGT GGA CAA CCT GTC CAC CGG CAG GAT CGC 

RAGSVGDLRGQPVHRQDR 
ERGLSVTCVDNLSTGRIA 
SGVCR*PAWTTCPPAGSR 

GRRARRRPAT*AAAPRRS 
VEVREGVLLPERQQPGVH 
FRSASASSSRNVSSRAST 



CTT GGA GCT GCG CGA GCG GCT GCT CCT CGC CAA GTG CGA CGA CGC CCG GCT GCA 
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27927 27936 27945 ' 27954- ' 27963 27972 

GAA CCT CGA CGC GCT CGC CGA CGA GGA GCG GTT CAC GCT GCT GCG GGC CGA CGT 



EPRRARRR GAVHAAAGRR 
NL DA LAD E ERFT L L R AD V 
TSTRSPTRSGSRCCGPT ' 

RATRRRPAPGGRRGGPTi 
GLREGDLPRDVVDDVQRR 
VSGNETSPGTWWTTWRAD 

CTG GCT CGG CAA GAG GCA GCT CCC CGG CCA GGT GGT GCA GCA GGT GGA CCG CAG 
27981 27990 27999 28008 28017 28026 

GAC CGA GCC GTT CTC CGT CGA GGG GCC GGT CCA CCA CGT CGT CCA CCT GGC GTC 

DRAVLRRGAGPPRRPPGV 
TEPFSVEGPVHHVVHLAS 
PSRSPSRGRSTTSSTWR] 

PRGGP SDPAAAPSAAPR « 
RGGGQVIQRQRQLRQP DA 
GAEGRS*RASGSSVSRTP 

CGG CCG GAG GGG GGA CCT GAT AGA CCG CGA CGG CGA CCT CTG CGA CGC CCA GCC 
28035 28044 28053 28062 28071 28080 

GCC GGC CTC CCC CCT GGA CTA TCT GGC GCT GCC GCT GGA GAC GCT GCG GGT CGG 

AGLP PG L SGAAAGDAAGR 
PASPLDYLALPLETLR-VG 
RPPPWTIWRCRWRRCGSi 

PRSR SRAAAPPPARRGS I 
RGPGLVRQPQRHRVAGAE 
EAPV SFASRSATACPARK 

GAG CCG GCC CTG GCT CTT GCG CGA CGC CGA CCG CCA CCG CGT GCC GCG GGC GAA 
28089 28098 28107 28116 28125 28134 

CTC GGC CGG GAC CGA GAA CGC GCT GCG GCT GGC GGT GGC GCA CGG CGC CCG CTT 

LGRDRERAAAGGGARRPL 
SAGT ENALRLAVAHGARF 
RPGPRTRCGWRWRTAPA 5 

PRRWRPSRRPDRRAGATI 
HDGGGRLDVPIGGLVRLG 
TTAEVESI*PSGASCGCD 

GCA CCA GCG GAG GTG GAG CCT CTA GAT GCC CCT AGG GCG GCT CGT GGG CGT CAG 
28143 28152 28161 28170 28179 28188 

CGT GGT CGC CTC CAC CTC GGA GAT CTA CGG GGA TCC CGC CGA GCA CCC GCA GTC 

RGRL HLGD LRGSRRAPAV 
VVAS TSE IYGDPAEHPQS 
WSPPPRRSTGIPPSTRSI 

S S PCR*GSRGANPTRRI 
LAVP AVDVRDARTRHVVL 
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S L *■ Q P L T IS G r P G RET Y S S 



GCT CTC GAT GAC CCC GTT GCA GTT GGG CTA GCC GGG CGC AAG CCA CAT GCT GCT 
28197 28206 28215 28224 28233 28242 

CGA GAG CTA CTG GGG CAA CGT CAA CCC GAT CGG CCC GCG TTC GGT GTA CGA* CGA 

RELLGQRQPDRPAFGVRR 
ESYWGNVNPIGPRSVYDE 
RATGATSTRSARVRCTTR 

WVT*RPASRRRRACAPRP 
GFPEGLRQGGGVRARQAR 
ALRNVSASVAA*ARVSP A 

CCG GTT TGC CAA GTG GCT CCG CGA CTG GCG GCG GAT GCG CGC GTG CGA CCC GCG 
28251 28260 28269 28278 28287 28296 

GGC CAA ACG GTT CAC CGA GGC GCT GAC CGC CGC CTA CGC GCG CAC GCT GGG CGC 

GQTVHRGADRRLRAHAGR 
AKRFTE ALTAAYARTLGA 
PNGSPRR*PPPTR ARWAR 

CRCQGGT*SRRVASAGRR 
VGANGAQEVGVSRPHAAV 
SVPMARRNLE*PGRI RRS 

CCT GTG GCC GTA ACG GGC GGA CAA GTT GAG GAT GCC TGG CGC CTA CGC GGC GCT 
28305 28314 28323 28332 28341 28350 

GGA CAC CGG CAT TGC CCG CCT GTT CAA CTC CTA CGG ACC GCG GAT GCG CCG CGA 

GHRHCPPVQLLRTADAPR 
DTGIARLFNSYGPRMRRD 
TPALPAC STPTDRGCAAT 

RAPPASR *RGPARRVAA * 
VPPHHRGEDVLREGSQRE 
SPRTTGVKMSWASAPSGS 

GCT GCC CGC CCA CCA CGG CTG GAA GTA GCT GGT CCG CGA GCG GCC TGA CGG CGA 
28359 28368 28377 28386 28395 28404 

CGA CGG GCG GGT GGT GCC GAC CTT CAT CGA CCA GGC GCT CGC CGG ACT GCC GCT 

RRAGGAD LHRPGARR TAA 
DGRVVPTFIDQALAGLPL 
TGGWCRPSSTRRSPD CR S 

W*RCRRGSGTATSRRPCP 
GDVAAAGLGPRQAVDLVR 
VMLPLPAWVRDSH*TSSV 



GTG GTA GTT GCC GTC GCC GCG GGT CTG GGC CAG CGA CAC GAT GCA GCT CCT GTG 
28413 28422 28431 28440 28449 28458 

CAC CAT CAA CGG CAG CGG CGC CCA GAC CCG GTC GCT GTG CTA CGT CGA GGA CAC 



HHQRQRRPDPVAVLRRGH 
TI NGSGAQTRSLCYVEDT 
PSTAAAPRPGRCATSRTR 
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APVSPGSPSTRGPGP*C: 
HPSQHGQHVRGERARDVD 
TRPSIARISEDKGPGTLM 



CCA CGC CCC TGA CTA CCG GGA CTA CCT GAG CAG GAA GGG CCC GGG CCA GTT GTA 
28467 28476 28485 28494 28503 28512 

GGT GCG GGG ACT GAT GGC CCT GAT GGA CTC GTC CTT CCC GGG CCC GGT CAA CAT 

GAGTDGPDGLVLPGPGQ H 
VRGLMALMDSSFPGPVN I 
C GD *WP * WTRPSRAR S T i 

RSRHSSRGDSRPPSRRV] 
ARGTLHGDTLDRLRDGCE 
PAVPSIVTR*IASAIAAS 

GCC GCG CTG GCC ACT CTA CTG GCA GGC AGT CTA GCG CCT CCG CTA GCG GCG TGA 
28521 28530 28539 28548 28557 28566 

cgg cgc gac cgg tga gat gac cgt ccg tca gat cgc gga ggc gat cgc cgc act 

rrdr*ddrpsdrggdrrt 
gatgemtvrqiaeaiaal 
arpvr*psvrsrrrsph; 

plpaasrtgrappprarc 
rshlqpglearrrlvlga 
aptssrvsnragasssgp 

gcg ccc tca cct cga cgc ctg gct caa ggc gcg cgg ccg cct cct gct cgg gcc 

28575 28584 28593 28602 28611 28620 

CGC GGG AGT GGA GCT GCG GAC CGA GTT CCG CGC GCC GGC GGA GGA CGA GCC CGG 

RGSGAADRVPRAGGGRAR 
AGVELRTEFRAPAEDEPG 
REWSCGPSSARRRRTSP 1 

ASGRCRSRWSSAPSSAR] 
PAAGVDLGGPRLQAPLGL 
RRQGSMSVALVFSPQFGS 

GGC CGC GAC GGG GCT GTA GCT CTG GCG GTC CTG CTT CGA CCC GAC CTT CGG GCT 
28629 28638 28647 28656 28665 28674 

CCG GCG CTG CCC CGA CAT CGA GAC CGC CAG GAC GAA GCT GGG CTG GAA GCC CGA 

PALPRHRDRQDEAGLEAR 
RRCPDI ETARTKLGWKPE 
GAAPTSRPPGRSWAGSPI 

AARRLA*ACGARTPSCR( 
HREGFPELAGQEPPLAGV 
TGSASP SLRVRSQHSLV* 



CCA CGG CGA 
28683 
GGT GCC GCT 



GCG GCT TCC 
28692 
CGC CGA AGG 



CGA GTT CGC 
28701 
GCT CAA GCG 



GTG GGA CGA 
2871 0 
CAC CCT GCT 



GAC CAC CCT 
28719 
CTG GTG GGA 



CTC GTG GAT 
28728 
GAG CAC CTA 
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G ' A A R R R" a g* A'*'* H P . A- L V r G. E H I, 
VPLAEGLKRTLLWWE STY 
CRSPKGSSAPCSGGRAP1 

APCPGRRRSRNSRC* SHI 
RPVHGVVAHVTRAVDPT S 
GRSMAWSPTFPELSMLLP 

GGG CGC CCT GTA CCG GGT GCT GCC GCA CTT GCC AAG CTC GCT GTA GTC CTC ACC 
28737 28746 28755 28764 28773 28782 

CCC GCG GGA CAT GGC CCA CGA CGG CGT GAA CGG TTC GAG CGA CAT CAG GAG TGG 

PAGHGPRRRERFERHQEW 
PRDMAHDGVNGSSDIRSG 
RGTWPT TA*TVRAT S GV] 

PMVLWVGAPLPTRI G R L ' 
RCSLGSVPRCPPASAGSR 
AAHCALCRGALPHPHGPA 

TCG CCG TAC TGT TCG GTC TGT GGC CGG CCG TTC CCC CAC GCC TAC GGG GCC TCG 
28791 28800 28809 28818 28827 28836 

AGC GGC ATG ACA AGC CAG ACA CCG GCC GGC AAG GGG GTG CGG ATG CCC CGG AGC 

S G ^m) TSQTPAGKGVRMPRS 
A A * QARHRPARGCGCPGA 
RHDKPDTGRQGGADAPE] 



SSSLT TQSHSSGSPMCTI 
RPV*RPRPTPRGRPCAPA 
DLFEVHDPLPV VGLAHLH 

CAG CTC CTT GAG TTG CAC CAG ACC CTC ACC CTG CTG GGG CTC CCG TAC GTC CAC 
28845 28854 28863 28872 28881 28890 

gtc gag gaa ctc aac gtg gtc tgg gag tgg gac gac ccc gag ggc atg cag gtg 

veelnvvwewddpegmqv 
srnstwsgsgttp r a c r c 
rgtqrglgvgrprghagj 

sap**grssyrrsrasr: 
arpsdaghrtdarghras 
perailgtvliqavtglp 

gcc gag cgc ccg ata gtc ggg gca ctg ctc ata gac gcg ctg gca cgg ctc gcc 

28899 28908 28917 28926 28935 28944 

CGG CTC GCG GGC TAT CAG CCC CGT GAC GAG TAT CTG CGC GAC CGT GCC GAG CGG 

RLAGYQPRDEYLRDRAER 
GSRAISPVTSICATVPSG 
ARGLSAP*RVSARPCRAI 

SWNAAASDRVGSVSRNS 
RGTPRPATGSGPCRDTRS 
DVLQGRRQGQGRVGI QEL 



TAG CTG GTC AAC CGG CGC CGC GAC AGG GAC TGG GGC CTG TGG CTA GAC AAG CTC 
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28.953 2:8962 2897T ^ 28980 28989 - \ 28998 

ATC GAC CAG TTG GCC GCG GCG CTG TCC CTG ACC CCG GAC ACC GAT CTG TTC GAG 



IDQLAAALSLTPDTDLFE 
.STSWPRRCP*PRTPI CSR 
RPVGRGAVPDPGHRSVRD 

PLPSPTMARSSAGRTPLR 

RCRRPR*PGRAPAGPRCG 
DAAALADHGALQRGPDAA 

TAG CCG TCG CCG CTC CCG CAG TAC CGG GCG CTC GAC CGC GGG GCC CAG CCG TCG 
29007 29016 29025 29034 29043 29052 

ATC GGC AGC GGC GAG GGC GTC ATG GCC CGC GAG CTG GCG CCC CGG GTC GGC AGC 

IGSGEGVMARELAPRVGS 
SAAARASWPASWRPGSAA 
RQRRGRHGPRAGAPGRQP 

SHASTLRDNRSFVRAVQA 
ATRPR*GTTGPSSGRWRH 
QQARVDAQREQLLGAGGT 

GAC GAC ACG CGC CTG CAG TCG GAC AGC AAG GAC CTC TTC TGG GCG CGG TGG ACA 
29061 29070 29079 29088 29097 29106 

CTG CTG TGC GCG GAC GTC AGC CTG TCG TTC CTG GAG AAG ACC CGC GCC ACC TGT 

LLCADVSLSFLEKTRATC 
CCARTSACRSWRRPAPPV 
AVRGRQPVVPGEDPRHLC 

PRGLTV*WWMRFS*RAP S 
PAAWR*RGGC-GSRSGPRV 
RPPGVDGVVVDPVVVQGS 

CGC CCC GCC GGG TTG CAG TGG ATG GTG GTG TAG GCC TTG CTG ATG GAC CGG CCT 
29115 29124 29133 29142 29151 29160 

GCG GGG CGG CCC AAC GTC ACC TAC CAC CAC ATC CGG AAC GAC TAC CTG GCC GGA 

AGRPNVTYHHIRNDYLAG 
RGGPTSPTTTSGTTTWPD 
GAAQRHLPPHPERLPGRT 

GSAEKSAPNASLTKMWRF 
EPRRRRRRIRA*RR*GGS 
KRVGG'EVGSEREVDEDVQ 

GAA GGC CTG CGG AGG AAG CTG CGG CCT AAG CGC GAG TTG CAG AAG TAG GTG GAC 
29169 29178 29187 29196 29205 29214 

CTT CCG GAC GCC TCC TTC GAC GCC GGA TTC GCG CTC AAC GTC TTC ATC CAC CTG 

LPDASFDAGFALNVF I HL 
FRTPPSTPDSRSTSSST* 
SGRLLRRRIRAQRLHPPE 

AK, U ST*R*RRSIRRT SRGP 
RRRPRGRGARSGAPAAAR 
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V G E I* D \T E \T Q A Ii D P P H* Q P G 



TTG CGG AAG CTC CAG ATG GAG ATG GAC 
29223 29232 29241 

AAC GCC TTC GAG GTC TAC CTC TAC CTG 



GCG CTC TAG GCC GCC CAC GAC GCC GGG 
29250 29259 29268 

CGC GAG ATC CGG CGG GTG CTG CGG CCC 




CCG CCG GCC 
29277 
GGC GGC CGG 



AAG GAG AAG 
29286 
TTC CTC TTC 



TTG ATG GAC 
29295 
AAC TAC CTG 



CTG AAG CCG 
29304 
GAC TTC GGC 



CTC CAG TGG 
2931 3 
GAG GTC ACC 



TCC GGC GTC 
29322 
AGG CCG CAG 



GGRFLFNYLDFGEVTRPQ 
AAGSSSTTWTSARSPGRS 
RPVPLQLPGLRRGHQAAV 

WSYTLL*GPACGTATLPN 
GRTR* S SGRPAGPRR* p I 
EVLVDLAVGPRVRDGDL S 

AAG GTG CTC ATG CAG TTC TCG ATG GGG CCC CGC GTG GGC CAG CGG CAG TTC CCT 
29331 29340 29349 29358 29367 29376 

TTC CAC GAG TAC GTC AAG AGC TAC CCC GGG GCG CAC CCG GTC GCC GTC AAG GGA 

FHEYVK SYPGAHPVAVK G 
STSTSRATPGRTRSPSRD 
PRVRQELPRGAPGRRQGI 

MDQSPVSTTRLSAASAP S 
*TRARCRRPGCARPPPRA 
E HGPEAGVHDALERRL GP 



AAG TAC AGG ACC GAG CCG TGG CTG CAC CAG GCG TTC GAG CGC CGC CTC CGG CCC 
29385 29394 29403 29412 29421 29430 

TTC ATG TCC TGG CTC GGC ACC GAC GTG GTC CGC AAG CTC GCG GCG GAG GCC GGG 

FMSWLGTDVVRKLAAE AG 
SCPGSAPTWSASSRRRPG 
HVLARHRRGPQARGGGRA 

VGTGPDCSSWPPTQK RVR 
SVPVRTARRGPRRRSG* G 
QCRYGP RVVVLAADAE E G 

GAC TGT GGC CAT GGG CCC AGC GTG CTG CTG GTC CCG CCG CAG ACG AAG GAG TGG 
29439 29448 29457 29466 29475 29484 

CTG ACA CCG GTA CCC GGG TCG CAC GAC GAC CAG GGC GGC GTC TGC TTC CTC ACC 

LTPVPG SHDDQGGVCF LT 
*H <V RYPGRTTTRAASA S SP 
DTGTRVARRPGRRLLPHP 
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RLSCSAAHPVARQSPLAG 
ACPVPPQTLYRVSPRCPG 
QAPFLLSRSTGCAPVALG 



GAC GCG TCC CTT GTC CTC CGA CGC ACT CCA TGG CGT GCG ACC CTG CCG TTC CGG 
29493 29502 29511 29520 29529 29538 

CTG CGC AGG GAA CAG GAG GCT GCG TGA GGT ACC GCA CGC TGG GAC GGC AAG GCC 




GGC TCC AGA GGA GGC AGA CGG ACC CGT GGA CCC GCG ACT CGC CCA AGA CCC CGT 
29547 29556 29565 29574 29583 29592 

CCG AGG TCT CCT CCG TCT GCC TGG GCA CCT GGG CGC TGA GCG GGT TCT GGG GCA 

PRSPPSAWAPGR*AGSGA 
RGLLRLPGHLGAERVLGQ 
EV S S VCL GTWAL S G F WG S 

PGLRGDLRDPAREVQADV 
RVSGATSATRRANSRPTL 
GSRAPRRPPGA RTRGPR* 



CGG CCT GGC TCG GCC GGC AGC TCC GCC AGG CCG CGC GCA AGC TGG ACC CGC AGT 
29601 29610 29619 29628 29637 29646 

GCC GGA CCG AGC CGG CCG TCG AGG CGG TCC GGC GCG CGT TCG ACC TGG GCG TCA 

AGPSRP SRRSGARSTWAS 
PDRA GRRGGPARVRP GRQ 
RTEPAVEAVRRAFDLGVN 

EEVGRVGVARAHGLRSQG 
KKSVACA*PAPMASAPSA 
SRRCRARRRRPCPRPPVP 

TGA AGA AGC TGT GGC GCG TGC GGA TGC CGC GCC CGT ACC GGC TCC GCC CTG ACC 
29655 29664 29673 29682 29691 29700 

ACT TCT TCG ACA CCG CGC ACG CCT ACG GCG CGG GCA TGG CCG AGG CGG GAC TGG 

TSST PRTPTARAWPRRDW 
LLRHRARLRRGHGRGGTG 
FFD TAHAYGAGMAEAGLA 

AAQAVQQAGTAGVDDDRR 
RPRP SRSRVRRESMTMEV 
GRGP RGAACGDSRCR *RS 



GGG CGC CGG 
29709 
CCC GCG GCC 



ACC CGC TGG 
29718 
TGG GCG ACC 



ACG ACG CGT 
29727 
TGC TGC GCA 



GGG CAG CGA 
29736 
CCC GTC GCT 



GGC TGT AGC 
29745 
CCG ACA TCG 



AGT AGA GCT 
29754 
TCA TCT CGA 
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p A. a :. W:'. . A- T C: * c: : A. P \p A P . T' : sr " s . S R 
PRPGRPAAHPSLRHRHLD 
RGLGDLLRTRRSDIVI ST 

LAAQLQPAVTHDAVAVGT 
FPPRSSRPSPTTRLL SAP 
S P R G P A A PRRHPGCCRRR 

GCT TCC CGC CGG ACC TCG ACG CCC CGC TGC CAC ACC AGG CGT TGT CGC TGC GGC 
29763 29772 29781 29790 29799 29808 

CGA AGG GCG GCC TGG AGC TGC GGG GCG ACG GTG TGG TCC GCA ACA GCG ACG CCG 

RRAAWSCGATVWSATATP 
EGRPGAAGRRCGPQQRRR 
KGGL E LRGDGVVRN S DAG 

EQAGVQGVAQARQP GVVH 
KRR ALRVSLRRE SPVS * T 
NGARWGSRCGASAPSRSR 

CAA AGG ACG CGC GGT TGG ACT GGC TGT CGG ACG CGA GCG ACC CCT GGC TGA TGC 
29817 29826 29835 29844 29853 29862 

GTT TCC TGC GCG CCA ACC TGA CCG ACA GCC TGC GCT CGC TGG GGA CCG ACT ACG 

VSCAPT*PTAC ARWGPTT 
FPARQPDRQPALAGDRLR 
FLRANLTDS LRSLGTDYV 

VHEQ DVPGVRPDRRGLRR 
STNRTWQGSGLTGGASVA 
PRTGPGSARGSPGAPRSP 

ACC TGC ACA AGG ACC AGG TGA CCG GGC TGG GCT CCC AGG GCG GCC GGC TCT GCC 
29871 29880 29889 29898 29907 29916 

TGG ACG TGT TCC TGG TCC ACT GGC CCG ACC CGA GGG TCC CGC CGG CCG AGA CGG 

WTCSWSTGPTRGSRRPRR 
GRVP GP LARPEG PAGRD G 
DVFLVHWPDPRVPPAETA 

TRQRPEHLFPEGPVHADG 
PASAPNTSSPSARYTPTE 
PHAPPTRPPLARGT RPRR 

GCC CAC GCG ACC GCC CCA AGC ACC TCC TTC CCG AGC GGG CCA TGC ACC CGC AGA 
29925 29934 29943 29952 29961 29970 

CGG GTG CGC TGG CGG GGT TCG TGG AGG AAG GGC TCG CCC GGT ACG TGG GCG TCT 

RVRWRGSWRKGSPGTWAS 
GCAGGVRGGRARPVRGRL 
GALA GFVEEGLARYVGVS 

VEGD LFHGFEGGDDGRLD 
LKVT SS IASNEETTVGCT 
WS*RRPFPRIRRRR* GAP 



GGT TGA AGT GGC AGC TCC TTT ACC GGC TTA AGA GGA GGC AGC AGT GGG GCG TCC 
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299.73. 29.9:88 29997* 30006* 3001 5 ; 1 •. 30024 

CCA ACT TCA CCG TCG AGG AAA TGG CCG AAT TCT CCT CCG TCG TCA CCC CGC AGG 



PTSPSRKWPNSPPSSPRR 
QLHRRGN GRILLRRH P A G 
NFTVEEMAEFSSVVTPQV 

GLHREVHEVAADLLLHQR 
AWTGNLMSSRPMSFCTSG 
RGPAT * CARGRCR SAPAA 

AGC GGG TCC ACG GCA AGT TGT ACG AGC TGG CGC CGT AGC TCT TCG TCC ACG ACG 
30033 30042 30051 30060 30069 30078 

TCG CCC AGG TGC CGT TCA ACA TGC TCG ACC GCG GCA TCG AGA AGC AGG TGC TGC 

SPRCRSTCSTAASRSRCC 
RPGAVQHARPRHREAGAA 
AQVPFNMLDRGIEKQVLP 

VAGSGPDADHPPRRERVP 
CQAAAP I PTMPHDASACP 
ASRRQRSRR*PTTPA RAR 

GCG TGA CGC GGC GAC GGC CCT AGC CGC AGT ACC CCA CCA GCC GCG AGC GCG TGC 
. 30087 30096 30-105 30114 30123 30132 

CGC ACT GCG CCG CTG CCG GGA TCG GCG TCA TGG GGT GGT CGG CGC TCG CGC ACG 

RTAPLPGSASWGGRRSRT 
ALRRCRDRRHGVVGARAR 
HCAAAGI GVMG'WSALAHG 

HQRSRETGALHERGVVPA 
TSAPASRGPWTNGGSSQR 
PAPPLAGDRGPTGARRSA 

CCC ACG ACC GCC CTC GCG AGG CAG GGC CGG TCC ACA AGG GCG GGC TGC TGA CCG 
30141 30150 30159 30168 30177 30186 

GGG TGC TGG CGG GAG CGC TCC GTC CCG GCC AGG TGT TCC CGC CCG ACG ACT GGC 

GCWRERSVPARCSRPTTG 
GAGGSAP SRPGVPARRLA 
VLAGALRPGQVFPPDDWR 

GVGRGELAFAEGLQERGH 
A*EGVKWPS RKAL SSAAT 
RRSGSR GPRVSRWAARPR 

CGC GGA TGA GGG GCT GGA AGG TCC CGC TTG CGA AGC GGT TCG ACG AGC GCC GGC 
30195 30204 30213 30222 30231 30240 

GCG CCT ACT CCC CGA CCT TCC AGG GCG AAC GCT TCG CCA AGC TGC TCG CGG CCG 

APTPRP SRANASPSCSRP 
RLLPDLPGRTLRQAARGR 
AYSPTFQGERFAKLLAAV 

V P Q LLEGGFAPVTDGLER 
SR SFSNAASRPCLTAWSA 
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ACC TGG CCG ACT TCC TCA AGC GGC GGC TTG CGC CCG TGT CAC AGC GGG TCG AGC 
30249 30258 30267 30276 30285 30294 

TGG ACC GGC TGA AGG AGT TCG CCG CCG AAC GCG GGC ACA GTG TCG CCC AGC TCG 

WTG*RSSPPNAGTVSP S S 
GPAEGVRRRTRAQCRPAR 
D R L K EFAAERGHSVAQLA 

KGPHQGVGRSDDRDDAGL 
SAQTSAWGEPTMGTMPAW 
AQRPAPGGRPL*GP*.RRG 

GCG AAC GGA CCC ACG ACC GGG TGG GGA GCC CTC AGT AGG GCC AGT AGC CGC GGG 
30303 30312 30321 30330 30339 30348 

CGC TTG CCT GGG TGC TGG CCC ACC CCT CGG GAG TCA TCC CGG TCA TCG GCG CCC 

RLPGCWPTPRESSRS SAP 
ACLGAG PPLGSHPGHRRP 
LAWVLAHPSGVIPVI GAQ 

KGLVQLVADPGHVEVEVL 
SGSCRSSLTRATSRSRSS 
AE RA-GP P CRGPRP GR G R R 

TCG AAG GGC TCG TGG ACC TCC TGT CGC AGG CCC GGC ACC TGG AGC TGG AGC TGC 
30357 30366 30375 30384 30393 30402 

AGC TTC CCG AGC ACC TGG AGG ACA GCG TCC GGG CCG TGG ACC TCG ACC TCG ACG 

S FPSTWRTASGPWTSTST 
ASRAPGGQRPGRGPRPRR 
LPEHLEDSVRAVDLDLDE 

GLQAGQVFQQGVRGLQVA 
ASSRARSSSSASAGS S SP 
PRAARGPRVAPRRARAPR 

TCC GGC TCG ACG CGC GGG ACC TGC TTG ACG ACC GGC TGC GCG GGC TCG ACC TGC 
3041 1 30420 30429 30438 30447 30456 

AGG CCG AGC TGC GCG CCC TGG ACG AAC TGC TGG CCG ACG CGC CCG AGC TGG ACG 

RPSCAPWTNCWPTRPSWT 
GRAARP GRTAGRRARAGR 
AELRALDELLADAPELDG 

APVLRGRAFLPRDSTAVS 
LPSWGGARSSLDTQPPW-P 
CRPGVARARLSTPRLHGR 

CGT CGC CCC TGG TTG GCG GGC GCG CGC TTC TCT CCA GCC AGA CTC CAC CGG TGC 
30465 30474 30483 30492 30501 30510 

GCA GCG GGG ACC AAC CGC CCG CGC GCG AAG AGA GGT CGG TCT GAG GTG GCC ACG 

AAGTNRPRAKRGRSEVAT 
QR GPTARARREVGLRWPR 
SG DQPPAREERSV*GGHG 
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IGTGWSLSQYSWNVT S IM 
SARGGA*RSTRGTSRRS * 
LHGDGLEVVPVVLQGDLD 

CTC TAC GGG CAG GGG GTC GAG TTG CTG ACC ATG CTG GTC AAC TGG CAG CTC TAG 
30519 30528 30537 30546 30555 30564 

GAG ATG CCC GTC CCC CAG CTC AAC GAC TGG TAC GAC CAG TTG ACC GTC GAG ATC 



(m) PVPQLND WYDQLTVE I / ^ J* 
CPSPSSTTGTTS*PSRS 



E 

R 

DARP PAQRLVRPVDRRDH 



.SRTQAGSEPQRSMPAPPP 
RVPRRGRSRSGPCRHRRR 
DFPDAGGVG AAQ VDT GAA 

TAG CTT GCC CAG ACG CGG GGG CTG AGG CCG ACG GAC CTG TAG CCA CGG CCG CCG 
30573 30582 30591 30600 30609 30618 

ATC GAA CGG GTC TGC GCC CCC GAC TCC GGC TGC CTG GAC ATC GGT GCC GGC GGC 

IERVCAPDSGCLDI GAGG 
SNGSAPPTPAA WTSVPAA 
RTGLRPRLRLPGHRCRRR 

S IRVCMRRAAGRPRCKAT 
RSG*ACAGPRGAPGASRP 
ALDERVHAPGGRPAPVER 

CCG CTC TAG GAG TGC GTG TAC GCG GCC CGG CGG GGC GCC CCG GCC GTG AAG CGC 
30627 30636 30645 30654 30663 30672 

GGC GAG ATC CTC ACG CAC ATG CGC CGG GCC GCC CCG CGG GGC CGG CAC TTC GCG 

GE ILT HMRRAAPRGRHFA 
AR S S R T CAGPPR GA G T S R 
RDPHAHAPGRPAGPALR G 

SGSGCY ASCSRR SKGSTV 
RAAAATRRVAAGRS GRP * 
DLRQRLVGFLQAA. VE GLD 

CAG CTC GGC GAC GGC GTC ATG CGG CTT GTC GAC GCG GCG CTG AAG GGG CTC CAG 
30681 30690 30699 30708 30717 30726 

GTC GAG CCG CTG CCG CAG TAC GCC GAA CAG CTG CGC CGC GAC TTC CCC GAG GTC 

VEPLPQYAEQLRRDFPEV 
SSRCRSTPNSCAATSPRS 
RAAAAVRRTAAPRL PRGH 

THCAAAAAVGPRSLKTWT 
PIAPRRPRWGQGPCSRGR 
RYPLGGRGGGRAPVAEDV 

TGC CAT ACC GTC CGG CGG CGC CGG CGG TGG GGA CCG GCC CTG TCG AAG CAG GTG 
30735 30744 30753 30762 30771 30780 

ACG GTA TGG CAG GCC GCC GCG GCC GCC ACC CCT GGC CGG GAC AGC TTC GTC CAC 
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RYGRPPRPPPLAGTASST 
GMAGRRGRHPWPGQLRPR 



TELGP*LPRRRRGYSRAS 
PRWGRSCRGAGGDTRGRR 
HDGVGAVAAQAAT RVVAG 

CAC CAG AGG TTG GGG CCG ATG TCG CCG GAC GCG GCG GCA GGC ATG CTG GCG CGG 
30789 30798 30807 30816 30825 30834 

GTG GTC TCC AAC CCC GGC TAC AGC GGC CTG CGC CGC CGT CCG TAC GAC CGC GCC 

VVSNPGYSGLRRRPYDRA 
WSPTPATAACAAVRT TAP 
GLQPRLQRPAPPSVRPRR 

SVRSSIATSVTRRSSTTG 
RSGPLSRPPCRVDPRRRG 
VLGQFLDRHVGYTQVVDD 

CTG CTC TGG GAC CTT CTC TAG CGC CAC CTG TGG CAT GCA GAC CTG CTG CAG CAG 
30843 30852 30861 30870 30879 30888 

GAC GAG ACC CTG GAA GAG ATC GCG GTG GAC ACC GTA CGT CTG GAC GAC GTC GTC 

DETLEE IAVDTVRLDDVV 
TRPWKR SRWTPYVWT T S S 
RDPGRDRGGHRT SGRRRP 

SSARTSRTLTSTSPPSTP 
RPRGRPGP*PPRPPRRPP 
GLVGAHVQDLHVHLAALH 

GGG CTC CTG CGG GCG CAC CTG GAC CAG TTC CAC CTG CAC CTC CCG CCG CTC CAC 
30897 30906 30915 30924 30933 30942 

CCC GAG GAC GCC CGC GTG GAC CTG GTC AAG GTG GAC GTG GAG GGC GGC GAG GTG 

PEDARVDLVKVDVEGGEV 
PRTPAWTWSRW TWRAARW 
RG'R.PRGPGQGGRGGRRGG 

ARRPAASSSRRCDGTTTK 
RGARPPRAAAGATGRPPR 
AGQAPRGLQQAPLGGHHD 

CCG CGG GAC GCG CCC CGC CGG CTC GAC GAC GCG GCC GTC AGG GGG CAC CAC CAG 
30951 30960 30969 30978 30987 30996 

GGC GCC CTG CGC GGG GCG GCC GAG CTG CTG CGC CGG CAG TCC CCC GTG GTG GTC 

GALRGAAELLRRQSPVVV 
APCAGRPSCCAGSPPWWS 
RPAR GGRAAAPAVPRGGL 

SCPPSWAIRS*PVVLSSR 
RVRRRGRSARSRCWWRRG 
EFVAAVVRHAVVAGGAVV 

AAG CTT GTG CCG CCG CTG GTG CGC TAC GCG CTG ATG CCG TGG TGG TCG CTG CTG 
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31005 3T0T4 31023 31032 31041 31050 

TTC GAA CAC GGC GGC GAC CAC GCG ATG CGC GAC TAC GGC ACC ACC AGC GAC GAC 



FEHGGDHAMRDYGTTSDD 
SNTAATTRCATTAPPATT 
RTRRRPRDARLRHHQR Rp 

HASSTSSRP*VSYVRGPQ 
TPAAPRRGRSCATCGAP S 
QPRQQDVVEAVRQVGQRA 

GAC ACC CGC GAC GAC CAG CTG CTG GAG CCG ATG TGC GAC ATG TGG GAC GGC CCG 
31059 31068 31077 31086 31095 31104 

CTG TGG GCG CTG CTG GTC GAC GAC CTC GGC TAC ACG CTG TAC ACC CTG CCG GGC 

LWALLVDDLGYTLYTLPG 
CGRCW S TT SATR CT P C RA 
VGAAGRRPRLHAVHPAGL 

SAASGPRSRAARAAS SRV 
APPPAPGRGPRERRRAAC 
PQRRLRAEVPGSEGGLQA 

ACC GAC CGC CGC CTC GGC CCG GAG CTG GCC CGG CGA GAG CGG CGG CTC GAC GCG 
31113 -31122 31131 31140 31149 31158 

TGG CTG GCG GCG GAG CCG GGC CTC GAC CGG GCC GCT CTC GCC GCC GAG CTG CGC 

WLAAEPGLDRAALAAELR 
GWRRSRASTGPLSPPSCA 
AGGGAGPRPGRSRRRAAH 

CHYKTASRPGRDARE GRP 
ATTSRRRDRAGTRGNGGL 
RLPVEDGIAPGQGGTGGS 

TGC GTC ACC ATG AAG CAG CGG CTA GCG CCC GGG GAC AGG CGG GCA AGG GGG GCT 
31167 31176 31185 31194 31203 31212 

ACG CAG TGG TAC TTC GTC GCC GAT CGC GGG CCC CTG TCC GCC CGT TCC CCC CGA 

TQWYFVADRGPLSARSPR 
RSGTSSPIAGPCPPVPPE 
AVVLRRRSRA PVRP F P PR 

STCEVHGICSGGGEGGER 
LLAN SMVSVVAGERAE RA 
SFHMRC SRYLQGRGRRGR 

CCT CTT CAC GTA AGC TGT ACT GGC TAT GTT GAC GGG GGA GGG AGC GGA GGG AGC 
31221 31230 31239 31248 31257 31266 

GGA GAA GTG CAT TCG ACA TGA CCG ATA CAA CTG CCC CCT CCC TCG CCT CCC TCG 

GEVHST*PIQLPPPSPPS 
E K C I R DRYNCPLPRLPR 
R S A F D (m) TDTTAPSLASLA 

V> 

D G HW .F AMDPLGAQERLVDGG 
TGSHWIRSVPRSGSCTVA 
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GCC AGG GGC TTA CGG TAT AGG CCC TCT GGC CGG ACG AGG GCC TCG TGC AGT GGC 
31275 31284 31293 31302 31311 31320 

CGG TCC CCG AAT GCC ATA TCC GGG AGA CCG GCC TGC TCC CGG AGC ACG TCA CCG 

RSP NAISGRPACSRSTSP 
GPRMPYPGDRPAPGARHR 
VPECHIRETGLLPEHVTA 

EPPLTHQGHAAQQAGGFQ 
KRRCPTSATRPRSLGAS S 
RGAAPHAPRARGASGRRV 

GGA AGG CCG CCG TCC CAC ACG ACC GGC ACG CGC CGG ACG ACT CGG GGC GGC TTG 
31329 31338 31347 31356 31365 31374 

CCT TCC GGC GGC AGG GTG TGC TGG CCG TGC GCG GCC TGC TGA GCC CCG CCG AAC 

PSGGRVCWPCAAC * A P P N 
LPAAGCAGRARPAEPRRT 
FRRQ GVLAVRGLLS PAE L 

LRHL LRRGAQDVVGPAGP 
SDTCSAAAPRISSAQRVR 
PTPAPPPPRGSRRRRACG 

ACC TCA GCC ACG TCC TCC GCC GCC GGC CGG ACT AGC TGC TGC GGA CCG CGT GGG 
31 383 31392 31401 31410 31419 31428 

TGG AGT CGG TGC AGG AGG CGG CGG CCG GCC TGA TCG ACG ACG CCT GGC GCA CCC 

WSRCRRRRPA*STTPGAP 
GVGAGGGGRPDRRRLAHP 
E SVQ EAAAGL I D DAWR T R 

GHVV GDPRQLGVLGVRGR 
DMCSVMQVSSGWSGSAAG 
TWARCWRSAPAGRARRPG 

CCA GGT ACG TGC TGT GGT AGA CCT GCG ACC TCG GGG TGC TCG GGC TGC GCC GGG 
31437 31446 31455 31464 31473 31482 

GGT CCA TGC ACG ACA CCA TCT GGA CGC TGG AGC CCC ACG AGC CCG ACG CGG CCC 

GPCTTPSGRWSPTSPTRP 
VHAR HHLDAGAPRARRGP 
SMHD TIWTLEPHEPDAAP 

DADL VDHVLGRHHGPQRA 
TRMSYTMSLDGTIARSAP 
PGCRTR*PCTGPSPGAPP 

GCC AGG CGT AGC TCA TGC AGT ACC TGT TCA GGG GCC ACT ACC GGG CCG ACC GCC 
31491 31500 31509 31518 31527 31536 

CGG TCC GCA TCG AGT ACG TCA TGG ACA AGT CCC CGG TGA TGG CCC GGC TGG CGG 

RSAS STSWTSPR*WPGWR 
GP H. RVRHGQVPGDGPAGG 
VRIEYVMDKSPVMARLAG 
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MRQQQAGHLGQDPRVED G 
WGS SSRAMSVRTPGFKM G 
GDAAAARWPSGPRASS* G 

CGG TAG GCG ACG ACG ACG CGC GGT ACC TCT GGG ACC AGC CCG GCT TGA AGT AGG 
31545 31554 31563 31 572 31 581 31 590 

GCC ATC CGC TGC TGC TGC GCG CCA TGG AGA CCC TGG TCG GGC CGA ACT TCA TCC 

AIRCCCAPWRPWSGRTS S 
PSAAAARHGDPGRAELH P 
HPLLLRAMETLVGPNF I P 

GPVAHHELGGRARGPQGP 
VQSLMTNLVVAPAGRSAQ 
WRPCCPT*SWRPRAGAPR 

GGT GGA CCC TGT CGT ACC ACA AGT TCT GGT GGC GCC CGC GCG GGG CCG ACC GGA 
31599 31608 31617 31626 31635 31644 

CCA CCT GGG ACA GCA TGG TGT TCA AGA CCA CCG CGG GCG CGC CCC GGC TGG CCT 

PPGTAWCSRPPRARPGWP 
HLGQHGVQDHRGRAPAGL 
TWDSMVFKTTAGAPRLAW 

VTVALHVGIGDGDGAATA 
CRSPWIYESATATVPPPR 
AGHRGSTSRHRRR*RR RD 

CCG TGG CAC TGC CGG TCT ACA TGA GGC TAC GGC AGC GGC AGT GGC CGC CGC CAG 
31653 31662 31671 31680 31689 31698 

GGC ACC GTG ACG GCC AGA TGT ACT CCG ATG CCG TCG CCG TCA CCG GCG GCG GTC 

GTVTARCTPMPSPSPAA V 
AP*RPDVLRCR RRHRRR S 
HRDGQMYSDAVAVT GGGR 

DDVHADVEVVRGLVVTD P 
TMSTPM*RSWAGSSLQTQ 
R*RRPCRGRGRARPC SHR 

CGC AGT AGC TGC ACC CGT AGA TGG AGC TGG TGC GCG GGC TCC TGT TGA CAC AGA 
31707 31716 31725 31734 31743 31752 

GCG TCA TCG ACG TGG GCA TCT ACC TCG ACC ACG CGC CCG AGG ACA ACT GTG TCT 

ASS TWASTSTTRPRTTVS 
RHRRGHLPRPRARGQLCL 
VIDVGI YLDHAPEDNCVW 

GDRLGVVPLVLLDGLGGV 
AMGCDL*QSSSCTVSVAS 
PWGATWS SPPRAP*RSRR 



CCC GGT AGG GCG TCA GGT TGA TGA CCC 
31761 31770 31779 

GGG CCA TCC CGC AGT CCA ACT ACT GGG 



TCC TGC TCG TCC AGT GGC TCT GGC GGC 
31788 31797 31806 

AGG ACG AGC AGG TCA CCG AGA CCG CCG 
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GHPAVQLLGGRAGHRDRR 
AIPQSNYWEDEQVTE TAD 



PEVGGLPVRGPGDGGHHP 
RSLAVSHSAVPATGAT I R 
GA*RWRTPRSRPRGRRSA 

TGG CCG AGT TGC GGT GGC TCA CCC TGC GCT GGC CCC GGC AGG GGC GGC ACT ACG 
31815 31824 31833 31842 31851 31860 

ACC GGC TCA ACG CCA CCG AGT GGG ACG CGA CCG GGG CCG TCC CCG CCG TGA TGC 

TGSTPPSGTRPGPSPP * C 
PAQRHRVGRDRGRPRRDA 
RLNATEWDATGAVPAVMR 

RAVGQQVVDQCQVAGRRH 
GPSARSCLMRVSCPAGAT 
APRRGAACCGSVARRGPP 

CCG GCC CGC TGC GGG ACG ACG TGT TGT AGG ACT GTG ACG TGC CGC GGG GCC GCC 
31869 31878 31887 31896 31905 31914 

GGC CGG GCG ACG CCC TGC TGC ACA ACA TCC TGA CAC TGC ACG GCG CCC CGG CGG 

GRATPCCTTS*HCTAPRR 
AGRRPAAQHPDTARRP GG 
PGDALLHNILTLHGAPAV 

HALLAPDDV VLVPGALHL 
TPLCRLTT**SYRGPST S 
PPCAACPRRSRTGARRPP 

ACC ACC CGT TCG TCG CGT CCC AGC AGA TGA TGC TCA TGG CCG GGC CGC TCC ACC 
31923 31932 31941 31950 31959 31968 

TGG TGG GCA AGC AGC GCA GGG TCG TCT ACT ACG AGT ACC GGC CCG GCG AGG TGG 

WWASSAGSSTTSTGPARW 
GGQAAQGRLLRVPARRGG 
VGKQRRVVYYEYRPGEVE 

TLEARVHGL VHPELLLHQ 
R*SPGCTGSYTPSLCCTS 
ADARGARARTRPA*AAPA 

TCG CAG TCG AGC CGG GCG TGC ACG GGC TCA TGC ACC CCG AGT TCG TCG TCC ACG 
31977 31986 31995 32004 32013 32022 

AGC GTC AGC TCG GCC CGC ACG TGC CCG AGT ACG TGG GGC TCA AGC AGC AGG TGC 

SVSSARTCPSTWGSSSRC 
ASARPARARVRGAQAAGA 
RQLGPHVPEYVGLKQQVL 

ARAQLLPGRGPLVPVLLG 
RAHRSCRAADPSCRSS SG 
ARTGPAAPRTRPAGPRPA 

ACG CGC GCA CGG ACC TCG TCG CCC GGC GCA GGC CCC TCG TGG CCC TGC TCC TCG 
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32031 ' 32040 32049 32058 32067 32076 

TGC GCG CGT GCC TGG AGC AGC GGG CCG CGT CCG GGG AGC ACC GGG ACG AGG AGC 



CARAWS SGPRPGSTGTRS 
ARVPGAAGRVRGAPGRGA 
RACLEQRAASGEHRDEEl 

ELVARHLLVPEPVLRGR] 
KSYRGTSCYRSQSSDGAI 
RRTGGPPATGARPRTARS 

GGA AGC TCA TGG CGG GCC ACC TCG TCA TGG CCG AGA CCC TGC TCA GCG GGC GCT 
32085 32094 32103 32112 32121 32130 

CCT TCG AGT ACC GCC CGG TGG AGC AGT ACC GGC TCT GGG ACG AGT CGC CCG CGA 

psstarwsstgs'gtsrpr 
lrvppggavpalgrvard 
feyrpveqyrlwdespa: 

gaqpervllvpppsgasc 

EPRRNGCSSYQRHHVQQA 
RRGATGARPTSATTFRSL 

AGA GGC CGG ACG CCA AGG GCG TGC TCC TCA TGA CCG CCA CCA CTT GGA CGA CTC 
32139 32148 32157 32166 32175 32184 

TCT CCG GCC TGC GGT TCC CGC ACG AGG AGT ACT GGC GGT GGT GAA CCT GCT GAG 

SPAC6SRTRSTGGGEPAE 
LRPAVPARGVLAV (v^ N L L S 
SGLRFPHEEYWRW* TC * i 

* -> 

GAAAPRARGPAPAGPRRi 
AQRQQAREGRRRRARAAL 
RRGS SPASAGAGARGPP S 

GGC GGA CGG CGA CGA CCC GCG CGA GCG GGG CCG CGG CCG CGC GGG CCC GCC GCT 
32193 32202 32211 32220 32229 32238 

CCG CCT GCC GCT GCT GGG CGC GCT CGC CCC GGC GCC GGC GCG CCC GGG CGG CGA 

PPAAAGRARPGAGAP GRR 
RLPLLGALAPAPARPGGE 
ACRCWARSPRRRRARAA £ 

WRGPP*RRASGPASRDAC 
GGGLLDDGLAEPLPGIRA 
GVAWSTMASRKRSRVSGR 

CGG GTG GCG GGT CCT CCA GTA GCG GCT CGC GAA GGC CCT CGC CTG GCT AGG CGC 
32247 32256 32265 32274 32283 32292 

GCC CAC CGC CCA GGA GGT CAT CGC CGA GCG CTT CCG GGA GCG GAC CGA TCC GCG 

AHRPGGHRRALPGADRSA 
PTAQEVIAERFRERTDPR 
PPPRRSSPSASGSGPlRi* 

R R wS PRRGDARGGCRAPR^ 
GAVP GVGMQEVEAVRQ GL 
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GGG GCC GCT GAC CCG GAT GCG GGT AGA CGA GCT GGA GGC GTT GCG CGA CCG GCT 
32301 32310 32319 32328 32337 32346 

CCC CGG CGA CTG GGC CTA CGC CCA TCT GCT CGA CCT CCG CAA CGC GCT GGC CGA 

PRRLGLRPSARPPQRAGR 
PGDWAYAHLLDLRNALAE 
PATGPTPICSTSATRWPS 

ARRPTPASARSRLPCRAT 
LEGPRRPAPEVESRAGRR 
CSAPADPRQSSKPAPVE G 

CGT CGA GCG GCC CCG CAG CCC CGC GAC CGA GCT GAA GCC TCG CCC GTG GAG CGG 
32355 32364 32373 32382 32391 32400 

GCA GCT CGC CGG GGC GTC GGG GCG CTG GCT CGA CTT CGG AGC GGG CAC CTC GCC 

AARRGVGALARLRSGHLA 
QLAGASGRWLDFGAGT SP 
SSPGRRGAGSTSERAPRR 

GRGAGRRGAPSPRSARRR 
VAVQEGAGPQLRGLHAAA 
YRSRSGPARSSVASIRPP 

CAT GGC GCT GGA CGA GGG GCC GCG GGC CGA CCT CTG CCG GCT CTA CGC GCC GCC 
32409 32418 32427 32436 32445 32454 

GTA CCG CGA CCT GCT CCC CGG CGC CCG GCT GGA GAC GGC CGA GAT GCG CGG CGG 

VPRPAPRRPAGDGRDARR 
YRDLLPGARLETAEMRGG 
T AT C S P A P GWRRP R C A A A 

PGSPPDRAPRPRATRGAP 
LVQRRI VLQVLGPQAAQR 
SSRVAS*SSSSAPSHPRG 

GCT CCT GGA CTG CCG CCT AGT GCT CGA CCT GCT CCG GCC CGA CAC GCC GGA CGG 
32463 32472 32481 32490 32499 32508 

CGA GGA CCT GAC GGC GGA TCA CGA GCT GGA CGA GGC CGG GCT GTG CGG CCT GCC 

RGPD GGSRAGRGRAVRPA 
EDLTADHELDEAGLCGLP 
R T * R R I TSWTRPGCAACR 

RSTRRHARWGPGPVR.S PG 
VAREVTHEGGLDQFVHRV 
SPENSPTSEVWTRSCTVS 

CCT GCC GAG CAA GCT GCC ACA CGA GAG GTG GGT CCA GGA CCT TGT GCA CTG CCT 
32517 32526 32535 32544 32553 32562 

GGA CGG CTC GTT CGA CGG TGT GCT CTC CAC CCA GGT CCT GGA ACA CGT GAC GGA 

GRLVRRCALHPQPGTRDG 
DG SFDGVLSTQVLEHVTD 
TARSTVCSPPRSWNT * R T 
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PGADARPAGAAAAPRCAP 
RVQMQALREPQQPRAAPQ 
GSRCRRSASRSSRGPPL S 

GGG CCT GGA CGT AGA CGC GCT CCG CGA GGC CGA CGA CGC CGG CCC GCC GTC CGA 
32571 32580 32589 32598 32607 32616 

CCC GGA CCT GCA TCT GCG CGA GGC GCT CCG GCT GCT GCG GCC GGG CGG CAG GCT 

PGPASARGAPAAAAGRQA 
PDLHLREALRLLRPGGRL 
RTC I CARRS GCCGRAA GW 

ATWAHRRPPARRAPGTAS 
HQGRMADPLLVAPLVQPA 
TSDVCPTQSSCPPCSRHR 

CCA CGA CAG GTG CGT ACC GCA GAC CCT CCT CGT GCC GCC CGT CCT GGA CAC CGC 
32625 32634 32643 32652 32661 32670 

GGT GCT GTC CAC GCA TGG CGT CTG GGA GGA GCA CGG CGG GCA GGA CCT GTG GCG 

gavhawrlggarragpva 
vlsthgvweehggqdlwr 
ccprmasgrstag'rtcga 

srrrvrpgpraprt * rp g 
pggvserglglpgpeghv 
qvaspsaawasrapnvt s 

GAC CTG GCG GCT GCC TGA GCG CCG GGT CCG GCT CGC CCG GCC CAA GTG GCA CCT 
32679 32688 32697 32706 32715 32724 

CTG GAC CGC CGA CGG ACT CGC GGC CCA GGC CGA GCG GGC CGG GTT CAC CGT GGA 

LDRRRTRGPGRAGRVH RG 
WTADGLAAQAERAGF TVD 
GPPTDSRP RPSGPGSPWT 

FP*A*RRVARDAAGAASG 
SRDLEGASRATQQE QQAV 
RVTLSVQPGRPRSSRSR* 

GGC TTG CCA GTT CGA GTG GAC GCC TGG CGC GCC AGA CGA CGA GGA CGA CGC GAT 
32733 32742 32751 32760 32769 32778 

CCG AAC GGT CAA GCT CAC CTG CGG ACC GCG CGG TCT GCT GCT CCT GCT GCG CTA 

PNGQAHLRTA RSAAPAAL 
RTVKLTCGPRGLLLLLRY 
ERSSSPADRAVCCSCCAT 

RGPARSAPPRDPRAAAA S 
VAPLVAPRRATRDPQQQp 

WPRSCPQGAPPGTPSSSR 

GGT GCC GGC CCT CGT GCC GAC CGG CCG CCC GCC AGG CCA GCC CGA CGA CGA CGC 
32787 32796 32805 32814 32823 32832 

CCA CGG CCG GGA GCA CGG CTG GCC GGC GGG CGG TCC GGT CGG GCT GCT GCT GCG 
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p. R P , G A R E A G G R* S' G R~ AAA A 
HGREHGWPAGGPVGLLLR 
TAGSTAGRRAVRSGCCCG 

GPGPRGAAGAGRRRSGRG 
GQGQGVPQARAEDVVVEV 
VRARASRSRGRRTSS *RS 

CTG GGA CCG GGA CCG GCT GGC CGA CGC GGG CGC GGA GCA GCT GCT GAT GGA GCT 
32841 32850 32859 32868 32877 32886 

GAC CCT GGC CCT GGC CGA CCG GCT GCG CCC GCG CCT CGT CGA CGA CTA CCT CGA 

DPGPGRPAAPAPRRRLPR 
TLALADRLRPRLVDDYLD 
PWPWPTGCARASSTTTST 

PRRRGLGRRPGPRATRGP 
PDEGALAADLARGLREVQ 
RTKAPWPRTSPGASGN * R 

GGC CCA GAA GCG GCC GGT TCC GGC GCA GCT CCC GGG CCG GCT CGG CAA GAT GGA 
32895 32904 32913 32922 32931 32940 

CCG GGT CTT CGC CGG CCA AGG CCG CGT CGA GGG CCC GGC CGA GCC GTT CTA CCT 

PGLRRPRPRRGPGRAVLP 
RVFAGQGRVEGPAEPFYL 
GSSPAKAASRARPSRSTW 

CGASRWCAARAPSAPSPR 
VDQQGGALRALRLLRLPV 
SMRSVALLGRSGSFGSLS 

CCT GTA GGA CGA CTG GCG GTC GTT CGG CGC GCT CGG CCT CTT CGG CCT CTC CCT 
32949 32958 32967 32976 32985 32994 

GGA CAT CCT GCT GAC CGC CAG CAA GCC GCG CGA GCC GGA GAA GCC GGA GAG GGA 

GHPADRQQAA RAGEAGEG 
DILLTASKPREPEKPERD 
T S C * PPASRASRRSRRGT 

S IVWGGGLGVMHT SGH I W 
RYSGAGAWDWWTHAAT SG 
AI HGLGRGTGGHTH .QRPD 

GCG CTA TAC TGG GTC GGG GGC GGG TCA GGG TGG TAC ACA CAC GAC GGC ACC TAG 
33003 33012 33021 33030 33039 33048 

CGC GAT ATG ACC CAG CCC CCG CCC AGT CCC ACC ATG TGT GTG CTG CCG TGG ATC 

R D (m} TQPPPSPTMCVLPWI X I* 
AI *PSPRP VPPCVCCRGS 
RYDPAPAQSHHVCAAVDP 



RHAEMSPT*PRQQTSSE I 
GTRRWRRHRRGSSHPRSS 
VQAGGDVTDVAAATHVVR 



GTG GAC ACG CGG AGG TAG CTG CCA CAG ATG CCG GCG ACG ACA CAC CTG CTG AGC 

- 129- 



3305.7 33066 33075" 33084' 33093"' 33102 

CAC CTG TGC GCC TCC ATC GAC GGT GTC TAC GGC CGC TGC TGT GTG GAC GAC TCG 



HLCAS IDGVYGRCCVDDS 
. T C AP P S T V S TAAAV W T T R 

PVRLHRRCLRPLLCGRLD 

YWLSSYSDSASGTKLSLA 
TGCRATR IRPPAPR * A * R 

HVVVLQVFGLRLRDE LEV 

TAC ATG GTG TTG CTC GAC ATG CTT AGG CTC CGC CTC GGC CAG AAG TTC GAG TTG 
33111 33120 33129 33138 33147 33156 

ATG TAC CAC AAC GAG CTG TAC GAA TCC GAG GCG GAG CCG GTC TTC AAG CTC AAC 

MYHNE LYESEAEPVF KLN 
CTTTSCTNPRRSRSS SST 
VPQRAVRIRGGAGLQA QR 

SATPQAGLER*ACSLGSS 
RRQRSRAWSGSRVPCDRH 
GVSDAARGVGAVCLV I Gl 

CGG CTG CGA CAG CCG ACG CGC GGG TTG AGG GCG ATG CGT GTC CTG TTA GGG CTA 
33165 33174 33183 33192 33201 33210 

GCC GAC GCT GTC GGC TGC GCG CCC AAC TCC CGC TAC GCA CAG GAC AAT CCC GAT 

ADAVGCAPNSRYA QDNPD 
PTLSAARPTPATHRT I PM 
RRCRLRAQLPLRTGQSR* 

TLPSVSANLIiG LMRRVRS 
P*LASRPT*CGWCAASGA 
LDSPQGLREVAGVHP PGP 

CTC CAG TCT CCC GAC TGG CTC CGC AAG TTG TCG GGG TTG TAC GCC GCC TGG GCC 
33219 33228 33237 33246 33255 33264 

GAG GTC AGA GGG CTG ACC GAG GCG TTC AAC AGC CCC AAC ATG CGG CGG ACC CGG 

EVRGL TEAFNSPNMRRTR 
RSEG*PRRSTAP"TCGGPG 
GQRADRGVQQPQHAADPA 

AISAPSRTDAHS*Q* *RS 
PSAPRRARTRTRSSSDGR 
QRHQGALAHGRAVVA IVA 

GAC CGC TAC GAC CGG CCG CTC GCG CAC AGG CGC ACG CTG ATG ACG ATA GTG GCG 
33273 33282 33291 33300 33309 33318 

CTG GCG ATG CTG GCC GGC GAG CGC GTG TCC GCG TGC GAC TAC TGC TAT CAC CGC 

LAMLAGERVSACDYCYHR 
WRCWPASACPRATTA I TA 
GDAGRRARVRVRLLL SPR 

SR ._PAVD*RCLMLSRNASV 
PGPRSTRGASC*RAT RRC 
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CTC CTG GCC CCG CGC TGC AGG ATG GCC GTC TCG TAG TTG CTC GCC AAG CGG CTG 
33327 33336 33345 33354 33363 33372 

GAG GAC CGG GGC GCG ACG TCC TAC CGG CAG AGC ATC AAC GAG CGG TTC GCC GAC 

EDRGATSYRQSINERFAD 
RTGARRPTGRASTSGSPT 
GPGRDVLPAEHQRAVRRR 

TSKASRASRVAGSPENSS 
PPSRRDPRVYRGRRS TRP 
RHVEGIQGFTGGGVAREL 

TGC CAC CTG AAG CGG CTA GAC CGG CTT GCA TGG CGG GGG CTG CCG AGC AAG CTC 
33381 33390 33399 33408 33417 33426 

ACG GTG GAC TTC GCC GAT CTG GCC GAA CGT ACC GCC CCC GAC GGC TCG TTC GAG 

TVDFADLAERTAPDGSFE 
RWTSPIWPNVPPPTARSR 
GGLRRSGRTYRPRRLVRG 

NGKKRSMRNPLVQLRRHT 
TGRRGRCGTRCCRCGATR 
LEGEEEVDPEAVGAVQPA 

CTC AAG GGG AAG AAG GAG CTG TAG GCC AAG CCG TTG TGG ACG TTG GAC GCC ACG 
33435 33444 33453 33462 33471 33480 

GAG TTC CCC TTC TTC CTC GAC ATC CGG TTC GGC AAC ACC TGC AAC CTG CGG TGC 

EFPFFLD IRFGNTCNLRC 
SSPSSSTSGSATPATCGA 
VPLLPRHPVRQHLQPA.VR 

I HA* G T L E P Q PA L F R GFH 
S TRRGP* SRSPHWSAGS I 
HHAGVRDAGAPTGLLARF 

CAC TAC ACG CGG ATG GGC CAG TCG AGG CCG ACC CCA CGG TTC TTC GCG GGC TTT 
33489 33498 33507 33516 33525 33534 

GTG ATG TGC GCC TAC CCG GTG AGC TCC GGC TGG GGT GCC AAG AAG CGC CCG AAA 

VMCAYPVSSGWGAKKRPK 
*CAPTRSAPAGVPRSARN 
DVRLPGQLRLGCQEAPEM 

DDATISGYRSSSSSHAVS 
TTRP SRGTGPPRPAT P SA 
PRGRHDVRVPLVLLQPRR 

ACC AGC AGG CGC CAC TAG CTG GGC ATG GCC CTC CTG CTC CTC GAC ACC CGC TGC 
33543 33552 33561 33570 33579 33588 

TGG TCG TCC GCG GTG ATC GAC CCG TAC CGG GAG GAC GAG GAG CTG TGG GCG ACG 

WSSAVI DPYREDEELWAT 
GR PR*STRTGRTRSCGRR 
VVRGDRPVPGGRGAVGDA 
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RSFAWRMRRSYKAPP SGK 
ARSRGG*GAATSRPRRAR 
QALVGVEDPPQVERAALG 

GAC GCG CTC TTG CGG GTG GAG TAG GCC GCC GAC ATG AAG CGC CCG CCG CTC GGG 
33597 33606 33615 33624 33633 33642 

CTG CGC GAG AAC GCC CAC CTC ATC CGG CGG CTG TAC TTC GCG GGC GGC GAG CCC 

LRENAHLIRRLYFAGGEP 
CARTPTSSGGCTSRAASP 
ARERPPHPAAVLRGRRAL 

MCGPWKAISSRSISVPLA 
*AARGSRSAPGASRSRCR 
EHLGAVERHQVQQDLGAV 

AAG TAC GTC GGG CCG GTG AAG CGC TAC GAC CTG GAC GAC TAG CTC TGG CCG TTG 
33651 33660 33669 33678 33687 33696 

TTC ATG CAG CCC GGC CAC TTC GCG ATG CTG GAC CTG CTG ATC GAG ACC GGC AAC 

FMQPGHFAMLDLLIETGN 
SCSPATSRCWTC*SRPAT 
HAARPLRDAGPADRDRQR 

SFTSMT*LELRVTSGSFT 
PFRRCRRCSWG*PAAPS P 
RFVDVDDVVGVERHQRLL 

CGC CTT TTG CAG CTG TAG CAG ATG TTG AGG TTG GAG TGC CAC GAC GGC CTC TTC 
33705 33714 33723 33732 33741 33750 

GCG GAA AAC GTC GAC ATC GTC TAC AAC TCC AAC CTC ACG GTG CTG CCG GAG AAG 

AENVD IVYNSNLTVLPEK 
RKTSTSSTTPTSRCCRRR 
GKRRHR LQLQPHGAAGEG 

KSRKGCKLLTPIPADQSP 
RRGSGAS*SRRSRRTRRR 
DEVAERVELADPDAR GAV 

CAG AAG CTG GCG AAG GGC GTG AAG TTC TCG CAG CCC TAG CCG CGC AGG ACG CTG 
33759 33768 33777 33786 33795 33804 

GTC TTC GAC CGC TTC CCG CAC TTC AAG AGC GTC GGG ATC GGC GCG TCC TGC GAC 

VFDRFPHFKSVGI GASCD 
SSTASRTSRASGSARPAT 
LRPLPALQERRDRRVLRR 

TPSTK SRMRWGAFHS TKT 
RRRPRRACGGARS TP RRR 
ADAL DE LADALGRLPVDE 

CCG CAG CCG CTC CAG AAG CTC GCG TAG GCG GTC GGG CGC TTC ACC CTG CAG AAG 
33813 33822 33831 33840 33849 33858 

GGC GTC GGC GAG GTC TTC GAG CGC ATC CGC CAG CCC GCG AAG TGG GAC GTC TTC 
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g v g- e v* f e" r x rt q p a k w d v f 
asarsssasasprsgts s 
rrrglrahpparevgrl: 



AFTRRALVSTFRHSWTAC 
RSRVGHWSRPSGTAGPRG 
DRVYATGLGLHVQPELDG 

CAG CGC TTG CAT GCG GCA CGG TTC TGG CTC CAC TTG GAC ACC GAG GTC CAG CGG 
33867 33876 33885 33894 33903 33912 

GTC GCG AAC GTA CGC CGT GCC AAG ACC GAG GTG AAC CTG TGG CTC CAG GTC GCC 

VANVRRAKTEVNLWLQVA 
SRTYAVPRPR*TCGSRSP 
RERTPCQDRGEPVAPGR] 

CRSFRHPSRSRSSKARS i 
AAAS GTPVAPGAARR GRP 

R-LPQVQPSQPVQQEEGAL 

GGC GTC GCC GAC TTG GAC ACC CCT GAC GCC CTG GAC GAC GAG AAG CGG GCG CTC 
33921 33930 33939 33948 33957 33966 

CCG CAG CGG CTG AAC CTG TGG GGA CTG CGG GAC CTG CTG CTC TTC GCC CGC GAG 

PQRLNLWGLRDLLLFARE 
RSG*TCGDCGTCCSSPAR 
AAAE PVGTAGPAALRPR ( 

PRSASRALTTCHGS SRD r . 
PGRRPGPWHRATARRGTP 
LAEVRVQGIDHLPGV VQR 

CTC CCG GAG CTG CGC CTG GAC CGG TTA CAG CAC GTC ACC GGG CTG CTG GAC AGC 
33975 33984 33993 34002 34011 34020 

GAG GGC CTC GAC GCG GAC CTG GCC AAT GTC GTG CAG TGG CCC GAC GAC CTG TCG 

EGLDADLANVVQWPDDLS 
RASTRTWPMSCSGPTTCR 
GPRR GPGQCRAVARR PV ( 

ALRGSSSFRRAVTSSAS i 
RWDGPRPSAVPSRRAPRV 
DGIERVLLLSPRGDLQGF 

CAG CGG TTA GAG GGC CTG CTC CTC TTC GCT GCC CGC TGG CAG CTC GAC CGG CTT 
34029 34038 34047 34056 34065 34074 

GTC GCC AAT CTC CCG GAC GAG GAG AAG CGA CGG GCG ACC GTC GAG CTG GCC GAA 

VAN L P D E E KRRAT V E L A E 
SPISRTRRSDGRPSSWPN 
RQSPGRGEATGDRRAGR1 

ASHH SP RSQLLGAAWRRi 
RRTTRRGPSSCARRGDAP 
EGLPAVAQVPALGGGMQP 

GAG CGG CTC ACC ACG CTG CCG GAC CTG ACC TCG TTC GGG CGG CGG GTA GAC GCC 
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34083 3409Z 34T0T 34 TVO 34TT9 34128 

CTC GCC GAG TGG TGC GAC GGC CTG GAC TGG AGC AAG CCC GCC GCC CAT CTG CGG 



LAEWCDGLDWSKPAAHLR 
SPSGATAWTGASPPPiCG 
RRVVRRP GLEQARRp SA( 

SLANMFAASGDSSIASP] 
ASRT * SRRQGT.RV S RRL L 
RQAREHVGSVRGFQDGFS 

CGC GAC TCG CGC AAG TAC TTG CGG CGA CTG GGC AGG CTT GAC TAG CGG CTT CCT 
34137 34146 34155 34164 34173 34182 

GCG CTG AGC GCG TTC ATG AAC GCC GCT GAC CCG TCC GAA CTG ATC GCC GAA GGA 

ALSAFMNAADPSELIAEG 
R*ARS*TPLTRPN* SPKE 
AERVHERR*PVRTDRRR] 

THAPRRF SGQN GLPQAL ( 
LILPDAFAARTASPSRLV 
SYSRTPSLQGPQRPAACS 



CCT CAT ACT 
34191 
GGA GTA TGA 



CGC CCA GCC 
34200 
GCG GGT CGG 



GCT TTC GAC 
34209 
CGA AAG CTG 



GGG ACC AAC 
34218 
CCC TGG TTG 



GGC TCC CCG 
34227 
CCG AGG GGC 



ACG CGT TCT 
34236 
TGC GCA AGA 




GGA TGC CTA GGC TCT GCC GCG ACC TGC CCA AGC TGG AGC AGC ACG GGC TCC CGT 
34245 34254 34263 34272 34281 34290 

CCT ACG GAT CCG AGA CGG CGC TGG ACG GGT TCG ACC TCG TCG TGC CCG AGG GCA 

PTDPRRRWTGSTS S CPRA 
LRI RDGAGRVRPRRARGH 
YGSETALDGFDLVVPEG1 

HAGQETGVARALGGGYAI 
THAR SPGLPAPLVVATRM 
RTRGARDWRRPCSWRRVC 

GGC ACA CGC GGG ACG AGC CAG GGT TGC CGC GCC CGT TCT GGT GGC GGC ATG CGT 
34299 34308 34317 34326 34335 34344 

CCG TGT GCG CCC TGC TCG GTC CCA ACG GCG CGG GCA AGA CCA CCG CCG TAC GCA 

PCAPCSVPTARARPPPYA 
RVRPARSQRRGQDHRRTH 
VCALLGPNGAGKTTAVR ] 

Q A ,J3 QELRVAATGQHGAE 1 
RLVRSLGSPPRARTAPRS 
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AGG ACT CGT GGG ACG AGT TCG GCC TGC CGC CGG CAC GGG ACC ACC GGC CGG AGC 
34353 34362 34371 34380 34389 34398 

TCC TGA GCA CCC TGC TCA AGC CGG ACG GCG GCC GTG CCC TGG TGG CCG GCC TCG 

S*APCSSRTAAVPWWPAS 
PEHPAQAGRRPCPGGRPR 

LSTLLKPDGGRALVAGLD 

HGALGGLHAPVDADGALV 
TVRSAASTRRFMPTVPWY 
HSGRPRRPAGSCRR*RGT 

TAC ACT GGG CGC TCC GGC GGC TCC ACG CGG CCT TGT AGC CGC AGT GGC CGG TCA 
34407 34416 34425 34434 34443 34452 

ATG TGA CCC GCG AGG CCG CCG AGG TGC GCC GGA ACA TCG GCG TCA CCG GCC AGT 

M*PARPPRCAGTSASPAS 
CDPRGRRGAPEHRRHRPV 
VTREAAEVRRNI GVT GQY 

RRDLLDQGAALVQLHPAA 
GATSSIRVPRSFRSIHPR 

GPPRPSGSRGRSGPSTP'G 

TGG GCC GCC AGC TCC TCT AGG ACT GGC CGG CGC TCT TGG ACC TCT ACA CCC CGG 
34461 34470 34479 34488 34497 34506 

ACC CGG CGG TCG AGG AGA TCC TGA CCG GCC GCG AGA ACC TGG AGA TGT GGG GCC 

TRRSRRS *PAARTWRC GA 
PGGRGDPDRPREPGDVGP 
PAVEEILTGRENLEMWGR 

EVVHAAPLRLATRFFQQL 
R*WTPRLSACRRVSSSSS 
GRGRPGCPPAAGYPLVAP 

CGG AGA TGG TGC ACC CGG CGT CCC TCC GCG TCG CGG CAT GCC TTC TTG ACG ACC 
34515 34524 34533 34542 34551 34560 

GCC TCT ACC ACG TGG GCC GCA GGG AGG CGC AGC GCC GTA CGG AAG AAC TGC TGG 

ASTTWAAGRRSAVRKNCW 
PLPRGPQGGAAPYGRTAG 
LYHVGRREAQRRTEELLE 

LEVQGLGGVLPELVVRAT 
CNSRVSAASLRSLC*EPP 
ATRGSRPRRCAA*A S SPR 

TCG TCA AGC TGG ACT GGC TCC GGC GGC TGT TCG CCG AGT TCG TGA TGA GCC CGC 
34569 34578 34587 34596 34605 34614 

AGC AGT TCG ACC TGA CCG AGG CCG CCG ACA AGC GGC TCA AGC ACT ACT CGG GCG 

SSST*PRPPTSGSSTTRA 
AV RPDRGRRQAAQALLGR 
QFDLTEAADKRLKHYSGG 
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HPAPEVQGGSEEGHGLHE 
I RRL S S RAAPNK VT G L T S 

YAACARGPRRIR*RAWPA 

CAT ACG CCG CGT CCG AGC TGG ACC GGC GGC CTA AGA AGT GGC ACG GGT TCC ACG 
34623 34632 34641 34650 34659 34668 

GTA TGC GGC GCA GGC TCG ACC TGG CCG CCG GAT TCT TCA CCG TGC CCA AGG TGC 

VCGAGSTWPPDSSPCPRC 
YAAQARPGRRIL HRAQGA 
MRRRLDLAAGFFTVPKVL 

EQVLGGGAEVRAVAVLDP 
KRSSGVVPRSGRLRL STQ 
RGPRAWWRGRGACGCRPR 

AGA AGG ACC TGC TCG GGT GGT GGC CGG AGC TGG GCG CGT TGG CGT TGC TCC AGA 
34677 34686 34695 34704 34713 34722 

TCT TCC TGG ACG AGC CCA CCA CCG GCC TCG ACC CGC GCA ACC GCA ACG AGG TCT 

SSWTSPPPASTRATATRS 
LPGRAHHRPRPAQPQRGL 
FLDEPTTGLDPRNRNEVW 

LHDTRHDLLAGGHQEGRL 
FITREITSCPVVTSSVVC 
SSPGNSPRAPCWRAA * WA 

CCT TCT ACC AGG CAA GCT ACC AGC TCG TCC CGT GGT GGC ACG ACG AGT GGT GCG 
34731 34740 34749 34758 34767 34776 

GGA AGA TGG TCC GTT CGA TGG TCG AGC AGG GCA CCA CCG TGC TGC TCA CCA CGC 

GRWSVRWSSRAPPCCSPR 
EDGP FDGRAGHHRAAHHA 
KMVR SMVEQGTTVL LTTQ 

VQLL GVPEGVLDRHDVRA 
YRSSASRSASWIETISAP 
TGPPPRGARRGSRPSRRP 

TCA TGG ACC TCC TCC GGC TGG CCG AGC GGC TGG TCT AGA GCC ACT AGC TGC GCC 
34785 34794 34803 34812 34821 34830 

AGT ACC TGG AGG AGG CCG ACC GGC TCG CCG ACC AGA TCT CGG TGA TCG ACG CGG 

STWRRPTGSPTRSR* S TR 
VPGGGRPARRPDLGDRRG 
YLEEADRLADQISVIDAG 

APDDLAGGLGQLGQHAAV 
RPTT SPVGSVRFDRTPPS 
GRPRRPCGRSGSTGPPRR 

CGG CGC CCC AGC AGC TCC CGT GGG GGC TCT GGG ACT TCA GGG ACC ACC CGC CGC 
34839 34848 34857 34866 34875 34884 

GCC GCG GGG TCG TCG AGG GCA CCC CCG AGA CCC TGA AGT CCC TGG TGG GCG GCG 
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PRGRRGHPRDPEVPGGRR 
RGVVEGTPETLKSLVGGD 



P D HHGQRGGLVQRGGRSL 
R ITTVRAAVSSRDAAAA * 
GSRPSGPPWRPGTPRRp E 

TGG CCT AGC ACC ACT GGG ACC GCC GGT GGC TCC TGG ACA GCC GGC GGC GCC GAG 
34893 34902 34911 34920 34929 34938 

ACC GGA TCG TGG TGA CCC TGG CGG CCA CCG AGG ACC TGT CGG CCG CCG CGG CTC 

TGSW*PWRPPRTCRPPRL 
PDRGDPGGHRGPVGRRGS 
RIVVTLAATEDLSAAAAQ 

DGAERPGLGLHVGLGATD 
TARKVPVSGSTSASARRI 
PRGS *P SRARPPRRPGGY 

TCC AGC GGG CGA AGT GCC CCT GGC TCG GGC TCC ACC TGC GGC TCC GGG CGG CAT 
34947 34956 34965 34974 34983 34992 

AGG TCG CCC GCT TCA CGG GGA CCG AGC CCG AGG TGG ACG CCG AGG CCC GCC GTA 

RSPASRGPSPRWTPRPAV 
GRPLHGDRARGGRRGPPY 
VARFTGTEPEVDAEARRI 

VRRYAVPDAVEHLDHLQQ 
SAGTRSRTPSRTSITCSS 
RRAPVRGPRRGRP SRAAA 

AGC TGC GCG GCC ATG CGC TGG CCC AGC CGC TGG AGC ACC TCT AGC ACG TCG ACG 
35001 35010 35019 35028 35037 35046 

TCG ACG CGC CGG TAC GCG ACC GGG TCG GCG ACC TCG TGG AGA TCG TGC AGC TGC 

STRRYATGSATSWRSCSC 
RRAGTRPGRRPRGDRAAA 
DAPVRDRVGDLVE IVQL L 

APLAVAHDIHRQAARRQ I 
RPCPWPTTSTDS RRGVSS 
ARAPGRRPRHTAAGGSAP 

ACG CGC CCG TCC CGG TGC CGC ACC AGC TAC ACA GCG ACG CGG CGG GCT GCG ACC 
35055 35064 35073 35082 35091 35100 

TGC GCG GGC AGG GCC ACG GCG TGG TCG ATG TGT CGC TGC GCC GCC CGA CGC TGG 

CAGRATAWSMCRCAARRW 
ARA .GPRR GRCVAAP P D A G 
RGQGHGVVDVSLRRPTLD 

VHEQVRGVTGTSPLLRDS 
STNRCAVLRAPRLFSGTP 
HRTGARSWGHRDF SPAPR 

TAC TGC ACA AGG ACG TGC GCT GGT TGG CAC GGC CAG CTT CCT TCC TCG GCC AGC 
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3510.9: 35118'- 35T27^: . 35T36" 351-45 35154 

ATG ACG TGT TCC TGC ACG CGA CCA ACC GTG CCG GTC GAA GGA AGG AGC CGG TCG 



MTCSCTRPTVPVEGRSRS 
. * RVP ARDQP CR S K E GA GR 

DVFLHATNRAGRRKEPVG 

SPRAPFPGSPR*RRSPPR 
HHGHQSPGAPGDGVAPHD 
I I AT S P LARQATV S P Q T T 

CTA CTA CCG GCA CGA CCC TTC CCG GGC GAC CCG GCA GTG GCT GCC GAC CCA CCA 
35163 35172 35181 35190 35199 35208 

GAT GAT GGC CGT GCT GGG AAG GGC CCG CTG GGC CGT CAC CGA CGG CTG GGT GGT 

DDGRAGKGPLGRHRRLGG 

(m) mavlgrarwavtdgwvv fft$r 

*WPCWEGPAGPSPTAGW 



GRWCS*SAACDRASRRSC 
AAGVHDVPPAIGPQDEVA 
PRALMILQRRLGPSIK*Q 

GCC GGC GCG GTT GTA CTA GTT GAC CGC CGC GTT AGG GCC CGA CTA GAA GAT GAC 
35217 35226 35235 35244 35253 35262 

CGG CCG CGC CAA CAT GAT CAA CTG GCG GCG CAA TCC CGG GCT GAT CTT CTA* CTG 

RPRQHDQLAAQSRADLLL 
GRANMI NWRRNPGL I FYC 
AAPT*STGGAIPG*SSTA 

STGS*SPPRRTRTRCRWT 
HHERDHRHDEPVHEAAGH 
MINGIMVTTKPYTNPLAM 

GTA CTA CAA GGG CTA GTA CTG CCA CCA GAA GCC CAT GCA CAA GCC GTC GCG GTA 
35271 35280 35289 35298 35307 35316 

CAT GAT GTT CCC GAT CAT GAC GGT GGT CTT CGG GTA CGT GTT CGG CAG CGC CAT 

HDVPD HD GGLRVRVRQRH 
MMFP IMTVVFGYVFGSAM 
*CSRS*RWSSGTCSAAPC 

RPPRRHSGRTGSAPATRV 
GHRAA TVVALEQHRPQE S 
DTAPPPS*RSNRIGPSNP. 

CAG GCA CCG CCC GCC GCC ACT GAT GGC GCT CAA GGA CTA CGG CCC CGA CAA GCC 
35325 35334 35343 35352 35361 35370 

GTC CGT GGC GGG CGG CGG TGA CTA CCG CGA GTT CCT GAT GCC GGG GCT GTT CGG 

VRGGRR * LPRVPDAGAVR 
SVAGGGDYREFLMPGLFG 
PWRAAVTTASS*CRGCSD 

PS^ w STRHR*WCAPR*WRPR 
LRHHETDDGAHQGDGARD 
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TGT CCG CTA CTA CAA GCC ACA GCA GTG GTC GTA CGA CCG GCA GTG GTC GCG CCA 
35379 35388 35397 35406 35415 35424 

ACA GGC GAT GAT GTT CGG TGT CGT CAC CAG CAT GCT GGC CGT CAC CAG CGC GGT 

TGDDVRCRHQHAGRHQRG 
QAMMFGVVTSMLAVTSAV 
RR*CSVSSPACWPSPARS 

GPRSRGTGSSASPATPRR 
GPAHGVPEARHRHRLRAD 
ERPTVSRNREIGIACDPT 

GAG GGC CCC GCA CTG GCT GGC CAA GGC GAG CTA CGG CTA CCG CGT CAG CCC GCA 
35433 35442 35451 35460 35469 35478 

CTC CCG GGG CGT GAC CGA CCG GTT CCG CTC GAT GCC GAT GGC GCA GTC GGG CGT 

LPGRDRPVPLDADGAVGR 
SRGVTDRFRSMPMAQ SGV 
PGA* PTGSARCRWRSRAS 

APGCSRRCT*SASRA* SG 
RQAAAEGVHEARQDLERD 
ASPRLKASMNLESI SSVI 

GCG CGA CCC GGC GTC GAA GCG GCT GTA CAA GTC GAG CGA CTA GCT CGA GTG CTA 
35487 35496 35505 35514 35523 35532 

CGC GCT GGG CCG CAG CTT CGC CGA CAT GTT CAG CTC GCT GAT CGA GCT CAC GAT 

RAGPQLRRHVQLADRAHD 
ALGRSFADMFSSL I ELTI 
RWAAASPTCSAR* S S SRS 

GRSRVAPRSASARPGRCP 
EEAASQQDAPAPVLAGAL 
RRPQPSSTPQRQCSPGPL 

GGA GGA GCC GAC GCC TGA CGA CCA GCC GAC CGC GAC CGT GCT CCC GGG GCC GTT 
35541 35550 35559 35568 35577 35586 

CCT CCT CGG CTG CGG ACT GCT GGT CGG CTG GCG CTG GCA CGA GGG CCC CGG CAA 

PPRLRTAGRLALARGPRQ 
LLGCGLLVGWRWHEGPGK 
SSAAD CWSAGAGTRAPAR 

APPARAAAATAS SA *RPR 
RQRREPQQQQPAVREDPD 
ASAASPSSSSHR*ESMQT 

CCG CGA CCG CCG CGA GCC CGA CGA CGA CGA CAC CGC GAT GAG CGA GTA GAC CCA 
35595 35604 35613 35622 35631 35640 

GGC GCT GGC GGC GCT CGG GCT GCT GCT GCT GTG GCG CTA CTC GCT CAT CTG GGT 

GAGGARAAAAVAL LAHLG 
ALAALGLLLLW RYSLIWV 
RW^RRSGCCCCGATRSSGS 
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SRGPAAAAGPPRRPPTH, 
PDVQPQQQGRLGGPRRIH 
PI *RPSSSGGSAAPAAYT 



GCC CTA GAT GGA CCC CGA CGA CGA CGG GGG CCT CCG GCG GCC CCG CCG CAT ACA 
35649 35658 35667 35676 35685 35694 

CGG GAT CTA CCT GGG GCT GCT GCT GCC CCC GGA GGC CGC CGG GGC GGC GTA TGT 

RDLPGAAAAPGGRRGGVC 
GIYLGLLLPPEAAGAAYV 
GSTWGCCCPRRPPGRRMC 

AAARSSAPSCRRRAP S Si 
RQQGQRHQRVGEDRRLLH 
GSSGKVI SAFVKTE G S F I 

CGG CGA CGA CGG GAA CTG CTA CGA CCG CTT GTG GAA GCA GAG CGG CCT CTT CTA 
35703 35712 35721 35730 35739 35748 

GCC GCT GCT GCC CTT GAC GAT GCT GGC GAA CAC CTT CGT CTC GCC GGA GAA GAT 

AAAALDDAGEHLRLAGED 
PLLPLTMLANTFVSPEKM 
RCCP*RCWRTPSSRRRR( 

RSAPCWRPTSGATRWPTI 
GAPQAGDRLPVRQGGRHG 
GPQSPVMASHFGSDEVTD 

CGG GCC GAC CGA CCC GTG GTA GCG CCT CAC CTT GGG CGA CAG GAG GTG CCA CAG 
35757 35766 35775 35784 35793 35802 

GCC CGG CTG GCT GGG CAC CAT CGC GGA GTG GAA CCC GCT GTC CTC CAC GGT GTC 

ARLAGHHRGVEPAVL HGV 
PGWLGTIAEWNPLSSTVS 
PAGWAPSRSGTRCPPRC3 

RGPATRCDPR*PRSRPRI 
GAPLQEAIRADRAAGPDG 
AQRSSNPLGPTVPPEQTA 

GCG GAC GGC CCT CGA CAA GCC GTT AGG CCC GCA GTG CCC GCC GAG GAC CCA GCG 
35811 35820 35829 35838 35847 35856 

CGC CTG CCG GGA GCT GTT CGG CAA TCC GGG CGT CAC GGG CGG CTC CTG GGT CGC 

rlpgavrqsgrhg'rllgr 
acrelfgnpgvtggswva 
pagscsairasraapgs3 

arsraprrrarvaapari 
lvrdlqgdgpgyqqqhee 
scaissataqgtssstsk 



GCT CGT GCG CTA GCT CGA CCG GCA GCG 
35865 35874 35883 

CGA GCA CGC GAT CGA GCT GGC CGT CGC 



GAC CGG GCA TGA CGA CGA CCA CGA GAA 
35892 35901 35910 

CTG GCC CGT ACT GCT GCT GGT GCT CTT 
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R- a v -. ■■ ' r : et r* a g- r k l a r t a a g a l 

EHAIELAVAWPVLLLVLF 
STRSSWPSPGPYCCWCSS 

aatpagsgsa*givvs sp 
hrqrhaavpreasswpll 
t g s d t rr * r v s lrh gr f f 

gca cgg cga cag cca cgc ggc gat ggc ctg cga gtc ggc tac tgg tgc ctt ctt 
35919 35928 35937 35946 35955 35964 

CGT GCC GCT GTC GGT GCG CCG CTA CCG GAC GCT CAG CCG ATG ACC ACG GAA GAA 

RAAVGAP LPDAQP (m) T T E E <^> 
VPLSVRRYRTLSR*PRKK 
CRCRCAATGRSADDHGRR 



FGAI LASGRATRS*RVMR 
SVPSSRRVAHRGARGSWA 
PFRRHAGFRTGDPEVPGH 

CCC TTT GGC CGC TAC TCG CGG CTT GGC GCA CGG CAG GCC GAG ATG GCC TGG TAC 
35973 35982 35991 36000 36009 3601 8 

GGG AAA CCG GCG ATG AGC GCC GAA CCG CGT GCC GTC CGG CTC TAC CGG ACC ATG 

GKPAMSAEPRAVRLYRTM 
GNRR*APNRVPSGSTGP C 
ETGDERRTACRPALPDHA 

RILSNSSRQRAIDSDPSI 
GS*PIRLVSGPSTATRPS 
AQDPFEFFAAQRHRQGPL 

GCG GAC TAG TCC CTT AAG CTT CTT GCG ACG GAC CGC TAC AGC GAC AGG CCC CTC 
36027 36036 36045 36054 36063 36072 

CGC CTG ATC AGG GAA TTC GAA GAA CGC TGC CTG GCG ATG TCG CTG TCC GGG GAG 

RLIREFEERCLAMSLSGE 
A* SGNSKNAAWRCRCP GR 
PDQGIRRTLPGDVAVRGD 

TPPMWG*MPWSATAAPTQ 
RRRCGGRCRGPPPPRRPR 

DDAADVGVDALLRHGGPD 

TAG CAG CCG CCG TAG GTG GGG ATG TAG CCG GTC CTC CGC CAC CGG CGG CCC CAG 
36081 36090 36099 36108 36117 36126 

ATC GTC GGC GGC ATC CAC CCC TAC ATC GGC CAG GAG GCG GTG GCC GCC GGG GTC 

IVGGIHPYIGQEAVAAGV 
SSAASTPTSARRRWPPGS 
RRRHPPLHRPGGGGRRGL 

AASVSSSTTVLVWRPWPW 
RPA* RRRRR*WCGDRGHG 
ARRE GVVVDDGAGMAAMA 



ACG CGC CGC GAG TGG CTG CTG CTG CAG CAG TGG TCG TGG GTA GCG CCG GTA CCG 
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36135 36144 36T53 36T62 361 7T 36180 

TGC GCG GCG CTC ACC GAC GAG GAC GTC GTC ACC AGC ACC CAT CGC GGC CAT GGC 

~r~ "a" a" "l "t" D D D V V T S T H R G H G 
C A A RRSPT TTSSPAPIAAMA 

R GAHRRRRRHQHPSRPWP 



TRAL PASGFRISASSHPV 

* G R W P L 
V D E G L S G 



p GRWPLRGSASAPRATRC 
K " VRLPHQGLQAA 



GTG CAG GAG CGG TTC CCT CGG CTG GGC TTC GCC TAC GAC COG CTC GAC ACG COG 
36189 36198 36207 36216 36225 36234 

CAC GTC CTC GCC AAG GGA GCC GAC CCG AAG CGG ATG CTG GCC GAG CTG- TGC GGC 

"h" T "l" "a" "k" "g" A D P K R M L A E L C G 

TSS PREPTRSGCWPSCAA 
R PRQG SRPEADAGRAVRH 



V A P R E R P 



RPPEICAASTL 



* 



SRRG SGPGRRSSARRRR 
R S / G A Q V P A A A _A_ _R_ _H_ _V_ _G_ _G_ _V_ _D_ 

'TGC t'gG CGG CCG GAC TTG GCC CCG GCG CCG CCG AGC TAC GTG CGG CGG CTG CAG 
36243 36252 36261 36270 36279 36288 

ACG ACC GCC GGC CTG AAC CGG GGC CGC GGC GGC TCG ATG CAC GCC GCC GAC GTC 



TTAGLNRGRGG S M H A A D V 

I P P A * T ' 
D R R P E P G 



RP PA*TGAAAARCTPPTS 

PRRLD ARRRRQ 



ppT *p A LPMTPAPAGMAA 
G RRRHRWRCRPPPRGWRR 
A E A D I A G V A D H P R_ A _G^ G_ _G_ 

TCG GAG CCG CAG ATA CCG CGG TTG CCG TAG CAC CCC CGC CCG CGG GGG TAG CGG 
36297 36306 36315 36324 36333 36342 

AGC CTC GGC GTC TAT GGC GCC AAC GGC ATC GTG GGG GCG GGC GCC CCC ATC GCC 

S~ "l" G _ V Y~ G A N G I V G A G A P I A 
ASASMAPTASWGRAPPSP 
P RRLWRQRHRGGGRPHRR 

PAAQDNWRRPSPRTATAK 
R HPRTTGAARHRGPPPPR 

G R T R G P R E L P A T V A _P_ _H_ _R_ G^ 

CGG CCA CGC CGG ACC AGC AAG GTC GCC GCG CCA CTG CCG GCC CAC CGC CAC CGG 
36351 36360 36369 36378 36387 36396 

GCC GGT GCG GCC TGG TCG TTC CAG CGG CGC GGT GAC GGC CGG GTG GCG GTG GCC 

T "o" T "a" V "s F Q R R G D G R V A V A 
PVRPGRSSGAVTAGWRWP 
RCG LVVPAAR*RPGGGGL 

kpspas lwptt s sanlra 

r R "R R H A * G P R P A P P T * G P 
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AAG AAG CCG CTG CCA CGC GAG TCG GTC CCG CAC CAC GAC CTC CGC AAG TTG GAC 
36405 36414 36423 36432 36441 36450 

TTC TTC GGC GAC GGT GCG CTC AGC CAG GGC GTG GTG CTG GAG GCG TTC AAC CTG 

FFGDGALSQGVVLEAFNL 
S SATVRSARAWCWRRSTW 
LRRRCAQPGRGAGGVQPQ 

ARHRSGTTNTQSF LP *AV 
PGTAAAPPTRRRSCRSRS 
RG QPPQRHHEDALVVAVR 

CGC CGG GAC ACC GCC GAC GGC CAC CAC AAG CAG ACG CTC TTG TTG CCG ATG CGC 
36459 36468 36477 36486 36495 36504 

GCG GCC CTG TGG CGG CTG CCG GTG GTG TTC GTC TGC GAG AAC AAC GGC TAC GCG 

AALWRLPVVFVCENNGYA 
RPCGGCRWCSSARTTATR 
GPVAAAGGVRLREQRLRD 

LRGSSRASAPSGTSLAAP 
WGAAPGPAPRRGPPSPPR 
GAQRQVPRQGAV RHLPRG 

TGG TCG GAC GGC GAC CTG GCC CGC GAC CGG CCG CTG GGC CAC CTC TCC CGC CGG 
36513 36522 36531 36540 36549 36558 

ACC AGC CTG CCG CTG GAC CGG GCG CTG GCC GGC GAC CCG GTG GAG AGG GCG GCC 

TSLPLDRALAGDPVERAA 
PACRWTGRWPATRWRGRP 
QPAAGPGAGRRPGGE GGR 

NPRVARATSPI SASATAS 
TRGSPARPPRFPRRRRRR 
PEAQRRARHVSHVGVGDG 

CCC AAG CCG GAC TGC CGC GCG CGC CAC CTG CCT TAC CTG CGG CTG CGG CAG CGG 
36567 36576 36585 36594 36603 36612 

GGG TTC GGC CTG ACG GCG CGC GCG GTG GAC GGA ATG GAC GCC GAC GCC GTC GCC 

GFGLTARAVDGMDADAVA 
GSA*RRARWTEWTPTPSP 
VRPD GARGGRNGRRRRRR 

AAASAT SRQRRPPPGVKR 
RPRRPRRVSGGPRRDWRG 
VRGGL GDFAAAPAAT GGE 

CTG CGC CGG CGG CTC CGG CAG CTT GCG ACG GCG GCC CCG CCG CCA GGG TGG AAG 
36621 36630 36639 36648 36657 36666 

GAC GCG GCC GCC GAG GCC GTC GAA CGC TGC CGC CGG GGC GGC GGT CCC ACC TTC 

DAAAEAVERCRRGGGPTF 
TR PPRP SNAAAGAAVPP S 
R G RRGRR TLPPGRR S HL P 

- 143- 



SQRV*RNLPWWEKS SCT! 
PSGCR"GT*RGGSRRPAPp 
QVAAGVPEVAVVGELLLH 



GAC CTG ACG GCG TGG ATG GCC AAG TTG CCG GTG GTG AGG AAG CTC CTC GTC CAC 
36675 36684 36693 36702 36711 36720 

CTG GAC TGC CGC ACC TAC CGG TTC AAC GGC CAC CAC TCC TTC GAG GAG CAG GTG 

LDCRTYRFNGHHSFEEQV 
WTAAPTGSTATTPSRSRW 
GLPHLPVQRPPLLRGAGC 

SF*RSSASTPSHRARSGS 
ASSGPRRRPRRTAHAHGA 
PQVVPVVGLDALPTRTVR 

CCC GAC TTG ATG GCC CTG CTG CGG CTC CAG CCG CTC ACC GCA CGC GCA CTG GGC 
36729 36738 36747 36756 36765 36774 

GGG CTG AAC TAC CGG GAC GAC GCC GAG GTC GGC GAG TGG CGT GCG CGT GAC CCG 

GLNYRDDAEVGEWRARDP 
G*TTGTTPRSASGVRVTR 
AELPGRRRGRRVACA * P i 

RVWLVRTSP AVAPAMSAJ 
ACGSCGRPRHSPRRWRRR 
QAGLAGAHVTRRGAGDVG 

GAC GCG TGG GTC TCG TGG GCG CAC CTG CCA CGC TGC CGG CCG CGG TAG CTG CGG 
36783 36792 36801 36810 36819 36828 

CTG CGC ACC CAG AGC ACC CGC GTG GAC GGT GCG ACG GCC GGC GCC ATC GAC GCC 

LRTQ STRVDGATAGA I DA 
CAPRAPAWTVRRPAPSTP 
AHPEHPRGRCDGRRHRRI 

VLVSI SSATSNARAPRAC 
SWCASRRPRPTRGRPGPG 
LGARQDVLGHLEGARAPG 

CTC TGG TCG TGC GAC TAG CTG CTC CGG CAC CTC AAG CGG GCG CGC CCG GCC CGG 
36837 36846 36855 36864 36873 36882 

GAG ACC AGC ACG CTG ATC GAC GAG GCC GTG GAG TTC GCC CGC GCG GGC CGG GCC 

ETSTL IDEAVEFARAGRA 
RPAR*STRPWSSPARAGP 
DQH ADRRGRGVRPRGPGI 

SGASASCWR*ASPVVGRC 
RGRRPAAGGKHRRC SGVA 
GVGGLRQVVKIGVARGWP 



GGG CTG GGG CGG CTC CGC GAC GTG GTG 
36891 36900 36909 

CCC GAC CCC GCC GAG GCG CTG CAC CAC 



GAA ATA CGG CTG CCG TGC TGG GGT GCC 
36918 36927 36936 

CTT TAT GCC GAC GGC ACG ACC CCA CGG 
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PTPPRRCTTFMPTARPHG 
RPRRGAAPPLCRRHDPTA 

PTI IQHSCKRVDGRQVLR 
RLSSRIAASAYMVASFWA 
GSHHDSPQVQTC*RASGP 

GGG CCT CAC TAC TAG ACT ACC GAC GTG AAC GCA TGT AGT GGC GCG ACT TGG TCC 
36945 36954 36963 36972 36981 36990 

CCC GGA GTG ATG ATC TGA TGG CTG CAC TTG CGT ACA TCA CCG CGC TGA ACC AGG 

PGVM I * - W L H L R T S PR * T R 
PE * * SDGCTCVHHRAEPG 
R S D D L (yj) AALAYI TALNQA 

Q V V L H R A VADADEALVH 
SCSSIARSSRTQTKPSST 
AARR SPARRGRRRRRRPR 

GCG ACG TGC TGC TCT ACC GCG CGC TGC TGG CGC AGA CGC AGA AGC CGC TCC TGC 
36999 37008 37017 37026 37035 37044 

CGC TGC ACG ACG AGA TGG CGC GCG ACG ACC GCG TCT GCG TCT TCG GCG AGG ACG 

R C T T RWRAT TAS A S S AR T 
AARRDGARRPRLRLRRGR 
LHDEMARDDRVCVFGEDV 

PDAEGLDGLAQVLAEAVS 
RIPRVWTALPRCSRKPSP 
ASRG* GPRWPGARASRRR 

ACG CCT AGC CGG AGT GGG TCC AGC GGT TCC CGG ACG TGC TCG CGA AGC CGC TGC 
37053 37062 37071 37080 37089 37098 

TGC GGA TCG GCC TCA CCC AGG TCG CCA AGG GCC TGC ACG AGC GCT TCG GCG ACG 

CGSASPRSPRACTSASAT 
ADRPHPGRQGPARALRRR 
RIGLTQVAKGLHERFGDG 

ADDVGG QRLLGEGAQGGA 
RTT SVGRDSCAKVLRAVP 
VRRRCGGTPAPR*WGPWR 

CTG CGC AGC AGC TGT GGG GGG ACA GCC TCG TCC GGA AGT GGT CGG ACC GGT GGC 
37107 37116 37125 37134 37143 37152 

GAC GCG TCG TCG ACA CCC CCC TGT CGG AGC AGG CCT TCA CCA GCC TGG CCA CCG 

DASSTPPCRSRPSPAWPP 
TRRRHPPVGAGLHQPGHR 
RVVDTPLSEQAFTSLATG 

RRHRPLSRDHLVLDGRQE 
AAIAPCRGTTSYWIGE S S 
RPSPPAAVPRPTGSGRAA 



CGC GCC GCT ACC GCC CCG TCG CTG GCC AGC ACC TCA TGG TCT AGG GGA GCG ACG 
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37T6T 37J7CT 37T79^ 37188T 37T97 37206 

GCG CGG CGA TGG CGG GGC AGC GAC CGG TCG TGG AGT ACC AGA TCC CCT CGC TGC 



ARRWRGSDRSWSTRSPRC 
RGDGGAATGRGVPDP LAA 
AAMAGQRPVVEYQIP SLL 

IQHELLDGVLRVLERQHG 
★ RTNSCIALWACLNESIV 
RDPTRASRWGPACTRAS S 

AGA TAG ACC ACA AGC TCG TCT AGC GGT TGG TCC GCG TGT TCA AGA GCG ACT ACT 
37215 37224 37233 37242 37251 37260 

TCT ATC TGG TGT TCG AGC AGA TCG CCA ACC AGG CGC ACA AGT TCT CGC TGA TGA 

SIWCSSRSPTRRTSSR* * 
LSGVRADRQPGAQVLADD 
YLVFEQIANQAHKFSLMT 

TPLHLDRDGIQHRAGTRA 
PPCTSTGTV*RTGPEPER 
RHAPPPGP*RDPAP SRNA 

GGC CAC CCG TCC ACC TCC AGG GCC AGT GGA TAG ACC ACG GCC CGA GGC CAA GCG 
37269 37278 37287 37296 37305 37314 

CCG GTG GGC AGG TGG AGG TCC CGG TCA CCT ATC TGG TGC CGG GCT CCG GTT CGC 

PVGRWRSRSPIWCRAPVR 
RWAGGGPGHLSGAGLRFA 
GGQVEVPVT YLVPGSGSR 

RAHGALVGVMGVAQE CVD 
EPMAPWCESWG*LRNACT 
SPCPRGASRGDRCGTRVR 

CGA GCC CGT ACC GGC CGG TCG TGA GGC TGG TAG GGA TGT CGG ACA AGC GTG TGC 
37323 37332 37341 37350 37359 37368 

GCT CGG GCA TGG CCG GCC AGC ACT CCG ACC ATC CCT ACA GCC TGT TCG CAC ACG 

ARAWPASTPTIPTACSHT 
LGHGRPALRPSLQPVRTR 
S .GMAGQHSDHPYSLFAHV 

ADLRDQGGGGRVGVAQQE 
PMLVTRGAVAESA* PR S S 
R C * SPGARWRRPR .RRGAA 

AGC CGT AGT TCT GCC AGG ACG GGC GGT GGC GGA GCC TGC GGA TGC CGG ACG ACG 
37377 37386 37395 37404 37413 37422 

TCG GCA TCA AGA CGG TCC TGC CCG CCA CCG CCT CGG ACG CCT ACG GCC TGC TGC 

SASR RSCPPPPRTPTACC 
RHQDGPARHRLGRLRPAA 
GIKTVLPATASDAYGLLL 

R R D TVRVRHGDERRARQH 
EA TRSGSGTATKAGLAS I 
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AGA GCC GCC AGG CAC TGG GCC TGG GCC ACC GGC AGA AGC GCG GCT CGC GCG ACT 
37431 37440 37449 37458 37467 37476 

TCT. CGG CGG TCC GTG ACC CGG ACC CGG TGG CCG TCT TCG CGC CGA GCG CGC TGA 

SRRSVTRTRWPS SRRAR * 
LGGP *PGPGGRLRAERAD 
SAVRDPD PVAVFAP SAL M 

ARDLLDGALEARHREPRG 
PVTSSTEPSSPGTGSPDA 
PCPRPPRRRARGPAARTP 

ACC CGT GCC AGC TCC TCC AGA GGC CGC TCG AGC CGG GCC ACG GCG AGC CCA GCC 
37485 37494 37503 37512 37521 37530 

TGG GCA CGG TCG AGG AGG TCT CCG GCG AGC TCG GCC CGG TGC CGC TCG GGT CGG 

WARSRRSPASSARCRSGR 
GHGRGGLRRARPGAARVG 
GTVEEVSGELGPVPLGS A 

PDVARALVDGDDGGALAH 
RIWRVPSSTVTTAVPWHT 
GSGG CPRPR*RRRWRGTR 

GGG CCT AGG TGG CGT GCC CGC TCC TGC AGT GGC AGC AGC GGT GGC CGG TCA CGC 
37539 37548 37557 37566 37575 37584 

CCC GGA TCC ACC GCA CGG GCG AGG ACG TCA CCG TCG TCG CCA CCG GCC AGT GCG 

PGSTARARTSPSSPPASA 
PDPPHGRGRHRRRHRPVR 
RIHRTGEDVTVVATGQCV 

MDGQGDRLGHRVLRRDL H 
CTARATASAMAS SAD I S T 
AHRGPRRPPWPPRPTSRP 

ACG TAC AGC GGG ACC GGC AGC GCC TCC GGT ACC GCC TGC TCC GCA GCT AGC TCC 
37593 37602 37611 37620 37629 37638 

TGC ATG TCG CCC TGG CCG TCG CGG AGG CCA TGG CGG ACG AGG CGT CGA TCG AGG 

CM S P WP S RRPWR T RRR S .R 
ACRP GRRGGHGGRGVDR G 
HVALAVAEAMAD EAS I E V 

H IRARDVRHVPLRDPRRR 
TSGRVI *GTSQSVIRADA 
PPDACSRGPPSPSSGPTP 

ACC ACC TAG GCG CGT GCT AGA TGG GCC ACC TGA CCC TCT GCT AGG CCC GCA GCC 
37647 37656 37665 37674 37683 37692 

TGG TGG ATC CGC GCA CGA TCT ACC CGG TGG ACT GGG AGA CGA TCC GGG CGT CGG 

WWIRARSTRWTGRRSGRR 
GGSAHDLPGGLGDDPGVG 
V D > RTIYPVDWETIRASA 
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LLGSPQDDDIVGVPHAPE 
SFVPRST TMSSAL RI HPN 

PSS RVAPR*RHRWGSTRT 



GCC TCT TCT GGC CTG CCG ACC AGC AGT AGC TAC TGC GGT TGG CCT ACA CGC CCA 
37701 37710 37719 37728 37737 37746 

CGG AGA AGA CCG GAC GGC TGG TCG TCA TCG ATG ACG CCA ACC GGA TGT GCG GGT 



RRRPDGWSSSMTPTGCAG 
GEDRTAGRHR*RQPDVRV 
EKTGRLVVIDDANRMCGF 




AGC CGC CGC TCC ACG ACC GGT GGC GCC GCC TCG TCA AGC TAG ACT GCC GGG CCG 
37755 37764 37773 37782 37791 37800 

TCG GCG GCG AGG TGC TGG CCA CCG CGG CGG AGC AGT TCG ATC TGA CGG CCC GGC 

SAARCWPPRRSSS I * R P G 
RRRGAGH RGGAV R S D GP A 
GGEVLATAAEQFDLTARP 

PPHGPRVARDDGVREHEV 
RRTVRGS PATMG*AS TS S 
GAPS GAPRRP*GRRARAR 



GGG CCG CCC ACT GGG CCG GCC TGC CGC GCC AGT AGG GGA TGC GCG AGC ACG AGC 
37809 37818 37827 37836 37845 37854 

CCC GGC GGG TGA CCC GGC CGG ACG GCG CGG TCA TCC CCT ACG CGC TCG TGC TCG 

PGG*PGRTARSSPTRS CS 
PAGDPAGRRGHPLRARAR 
RRVTRPDGAVIPYALVLD 



LRQQRVRGLQGVRDTGDQ 
WANS GSAAWSVSA I RATR 
GP TAAPRPGASRR SGHRG 

TGG TCC GCA ACG ACG GCC TGC GCC GGG TCG ACT GGC TGC GCT AGG CAC GGC AGG 
37863 37872 37881 37890 37899 37908 

ACC AGG CGT TGC TGC CGG ACG CGG CCC AGC TGA CCG ACG CGA TCC GTG CCG TCC 

TRRCCRTRPS*PTRSVPS 
PGVAAGRGPADRRDP CRP 
Q A L LPDAAQLTDAI RAVL 

LSAARRPGSEFPLSSSNR 
FHRPVVLGQSSRSL-LHI G 
STVRCSSARVRVPSFIFE 



ACT TCA CTG 
3791 7 
TGA AGT GAC 



CGC CGT GCT 
37926 
GCG GCA CGA 



GCT CCG GGA 
37935 
CGA GGC CCT 



CTG AGC TTG 
37944 
GAC TCG AAC 



CCC TCT CTT 
37953 
GGG AGA GAA 



CTA CTT AAG 
37962 
GAT GAA TTC 
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* S D' A A R R G P D S N G' R E* D E F 
EVTRHDEALTRTGEK (m) N S 
K*RGTTRP*LERERR* 11 



ADAAPRS S*RRSWRAT SA 
LTPRPDHRDGDPGVLQAP 
SRRGRTTVIVTPVLSSHQ 

GCT CGC AGC CGG CGC CCA GCA CTG CTA GTG GCA GCC CTG GTT GCT CGA CAC GAC 
37971 37980 37989 37998 38007 38016 

CGA GCG TCG GCC GCG GGT CGT GAC GAT CAC CGT CGG GAC CAA CGA GCT GTG CTG 

RASAAGRDDHRRDQRAVL 
ERRPRVVTITVGTNELCW 
SVGRGS*RSPSGPTSCAG 

PGTDRSRAPCRCWRSRGP 
QVP'TEAGQQVAVGGAEVQ 
SSRHRPEKSSLSVVPKSR 

CGA CCT GGC CAC AGA GCC GAG GAA CGA CCT GTC GCT GTG GTG GCC GAA GCT GGA 
38025 38034 38043 38052 38061 38070 

GCT GGA CCG GTG TCT CGG CTC CTT GCT GGA CAG CGA CAC CAC CGG CTT CGA CCT 

AGPVSRLLAGQRHHRLRP 
LDRCLGSLLDS DTTGFDL 
WTGVSAPCWTATPPASTW 

PRSRRCRSPPRCHRAHAR 
LDAVDVVVRRVATD LMHA 
STQ*TSLSEASPLTSCTR 

CCT CCA GAC GAT GCA GCT GTT GCT GAG CCG CCT GCC GTC ACA GCT CGT ACA CGC 
38079 38088 38097 38106 38115 38124 

GGA GGT CTG CTA CGT CGA CAA CGA CTC GGC GGA CGG CAG TGT CGA GCA TGT GCG 

GGLLRRQRLGGRQCRACA 
EVCYVDNDSADGSVEHVR 
RSATSTTTRRTAVSSMCA 

SRARPSS*GCRGCDPSRR 
RGPGRHRDDAVVA I QAEG 
AVQGATVIMRLSRLRPKA 

GCG CTG GAC CGG GCG CCA CTG CTA GTA GGC GTT GCT GGC GTT AGA CCC GAA GCG 
38133 38142 38151 38160 38169 38178 

CGC GAC CTG GCC CGC GGT GAC GAT CAT CCG CAA CGA CCG CAA TCT GGG CTT CGC 

RDLARGDDHPQRPQSGLR 
ATWPAVTI IRNDRNLGFA 
RPGPR*RSSATTAIWASP 

PSCRRCGGRGPTRRP SRT 
PR VVDADAAGQL GARVVH 
PAFLTPMRRARSDPAS *T 



GCC CCG CTT GTT GCA GCC GTA GGC GGC GCG GGA CCT CAG GCC GCG CCT GAT GCA 
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38187 38T96 38205 38214 38223 38232 

CGG GGC GAA CAA CGT CGG CAT CCG CCG CGC CCT GGA GTC CGG CGC GGA CTA CGT 



RGE QRRHPPRPGVRRGLR 
GANNVG I RRALE S GA D YV 
GRTT SASAAPWSPART T< 

GR*GRCRSAARGPARV*'] 
EEDVGVGPRRGVQHAS EG 
NRTLGSVQVGGSRTRP SV 

CAA GGA GCA GTT GGG GCT GTG GAC CTG CGG COG GCT GGA CCA CGC GCC TGA GTG 
38241 38250 38259 38268 38277 38286 

GTT CCT CGT CAA CCC CGA CAC CTG GAC GCC GCC CGA CCT GGT GCG CGG ACT CAC 

VPRQPRHL DAARPGARTH 
FLVNPDTWTPPDLVRGLT 
SSSTPTPGRRPTWCADS] 

VPRP I APTRCRRGAA T G I 
FQGLFPRLVADDARQLVA 
SSASSHGSYPMTPGSCYR 

GCT TGA CCG GCT CCT TAC CGG CCT CAT GCC GTA GCA GCC GGG CGA CGT CAT GGC 
38295 38304 38313 38322 38331 38340 

CGA ACT GGC CGA GGA ATG GCC GGA GTA CGG CAT CGT CGG CCC GCT GCA GTA CCG 

RTGRGMAGVRHRRPAAVP 
ELAEEWPEYGIVGPLQYR 
NWPRNGRSTASSARCSTi 

RGRSWPARRT*RTSACP( 
VVGVGRREVLEVLPRVRG 
*SGSEVASSSNLSHVCVA 

GAT GCT GGG GCT GAG GTG CCG CGA GCT GCT CAA GTT GCT CAC CTG CGT GTG CCG 
38349 38358 38367 38376 38385 38394 

CTA CGA CCC CGA CTC CAC GGC GCT CGA CGA GTT CAA CGA GTG GAC GCA CAC GGC 

LRPRLHGARRVQRVDAHG 
YDPD STALDEFNEWTHTA 
TTPTPRRSTSSTSGRTRI 

TAPRAARRRRRRSRGDRC 
QPQALLVGEGAVPDGMGG 
RHSPSCCAKAPSPIAWGE 

GGA CAC CGA CCC GCT CGT CGT GCG GAA GCG GCC GCT GCC CTA GCG GGT AGG GAG 
38403 38412 38421 38430 38439 38448 

CCT GTG GCT GGG CGA GCA GCA CGC CTT CGC CGG CGA CGG GAT CGC CCA TCC CTC 

PVAGRAARLRRRRDRP SL 
LWLGEQHAFAGDGI AHP S 
CGWA S STPSPATGSP I PI 

P P _A ASPAPGVSAPARRH/ 
RRPQRLPPGWPRQLVG I H 

- 150- 



G A P S G F P R A G R V" S~ S C A ' * T 



GGG CCG CCC CGA CGG CTT CCC CGC CCG GGG TGC CTG CGA CCT CGT GCG GAT ACA 
38457 38466 38475 38484 38493 38502 

CCC GGC GGG GCT GCC GAA GGG GCG GGC CCC ACG GAC GCT GGA GCA CGC CTA TGT 

PGGAAE GAGPTDAGARL C 
PAGLPKGRAPRTLEHAYV 
RRGCRRGGPHGRWSTPMC 

PNPARRGSRSAARSRAAR 
LTRREEGPGRHQALDPQE 
CPEASKARVAISRSIPS S 

CGT CCC AAG CCG CGA GAA GCG GGC CTG GCG CTA CGA CGC GCT CTA GCC CGA CGA 
38511 38520 38529 38538 38547 38556 

GCA GGG TTC GGC GCT CTT CGC CCG GAC CGC GAT GCT GCG CGA GAT CGG GCT GCT 

AGFGALRPDRDAARDRAA 
QGSALFARTAMLREIGLL 
RVRRSSPGPRCCARSGCS 

RPAACRSRPSRGTGGPGS 
VLHQVGVVLLGVQAAPGA 
SSTSCV**SSVSRHRRAR 

GCT GCT CCA CGA CGT GTG GAT GAT GCT CCT CTG GCT GGA CAC GGC GGC CCG GGC 
38565 38574 38583 38592 38601 38610 

CGA CGA GGT GCT GCA CAC CTA CTA CGA GGA GAC CGA CCT GTG CCG CCG GGC CCG 

RRGAAHLLRGDRPVPPGP 
DEVLHTYYEETDLCRRAR 
TRCCTPTTRRPTCAAGPA 

PPSAPPGAGPGPCGAGPR 
P RAPPHGQVQVQADLVPA 
QAPQRTARCRSRPMWCRP 

GAC CCG CCC GAC CGC CCA CCG GGA CGT GGA CCT GGA CCC GTA GGT CGT GGC CCC 
38619 38628 38637 38646 38655 38664 

CTG GGC GGG CTG GCG GGT GGC CCT GCA CCT GGA CCT GGG CAT CCA GCA CCG GGG 

LGGLAGGPAPGPGHPAPG 
WAGWRVALHLDLGIQHRG 
GRA GGWPCTWTWAS STGA 

RRPSRPWCTCGPGCAACG 
AAPRGHGARVAPDVHPAV 
PPPAVTALVYLRTWMRRL 

GCC GCC GCC CCG CTG GCA CCG GTC GTG CAT GTC GGC CCA GGT GTA CGC CGC GTT 
38673 38682 38691 38700 38709 38718 

CGG CGG CGG GGC GAC CGT GGC CAG CAC GTA CAG CCG GGT CCA CAT GCG GCG CAA 

RRRGDRGQHVQPGPHAAQ 
G G G ATVASTYSRVHMRRN 
AAGRPWPARTAGST CGAT 
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SSSGR*RRRSAGPSPRGA 
AVVVEE GVDVPVRRLGGP 
R***RKVSTSQCGAFAAR 



GGC GAT GAT GAT GGA GAA GTG GCT GCA GCT GAC CGT GGG CCG CTT CCG GCG GGC 
38727 38736 38745 38754 38763 38772 

CCG CTA CTA CTA CCT CTT CAC CGA CGT CGA CTG GCA CCC GGC GAA GGC CGC CCG 

PLLLPLHRRRLAPGEGRP 
RYYYLFTDVDWHPAKAAR 
ATTTSSPTSTGTRRRPPG 

RRASARPPG*PGCRRRGR 
EGPAPEHRVEH AAADDAA 
SAPRQSTASRMPRLTTPR 

CGA GCG GCC CGC GAC CGA GCA CCG CCT GGA GTA CCC GGC GTC GCA GCA GCC GGC 
38781 38790 38799 38808 38817 38826 

GCT CGC CGG GCG CTG GCT CGT GGC GGA CCT CAT GGG CCG CAG CGT CGT CGG CCG 

ARRALARGGPHGPQRRRP 
LAGRWLVADLMGRSVVGR 
SPGAGSWR TSW AAASSAA 

GPRS RLAPSWRPAASARR 
DRG 'RGS RPLGDLRQAP E G 
TGAAVPARSVMSASRQ SA 

GCA GGG CCG GCG CTG GCC TCG CGC CCT CTG GTA GCT CCG CGA CGC GAC CGA GCG 
38835 38844 38853 38862 38871 38880 

CGT CCC GGC CGC GAC CGG AGC GCG GGA GAC CAT CGA GGC GCT GCG CTG GCT CGC 

RPGRDR SAGDHRGAALAR 
VPAATGARETIEALRWLA 
SRPRPERGRPSRRCAGSP 

GPASWAT GGGPGGRAAR E 
VPHRGHP GAAPVVARQA S 
SRTGVMRDRRRSWRASRA 

GCT GGC CCA CGG CTG GTA CGC CAG GGC GGC GGC CCT GGT GGC GCG CGA CGC GCG 
38889 38898 38907 38916 38925 38934 

CGA CCG GGT GCC GAC CAT GCG GTC CCG CCG CCG GGA CCA CCG CGC GCT GCG CGC 

RPGADHAVPPPGPPRAAR 
DRVP TMR SRRRDHRALRA 
TGCRPC GPAAGT TARCAL 

RRARRP SPPTRI LGNFTA 
AAPAARRLPRGS SATSPP 
RPPRPAAFPADQHPRQLH 



AGC GCC GCC CGC GCC GCG CCG CTT CCC 
38943 38952 38961 

TCG CGG CGG GCG CGG CGC GGC GAA GGG 



CCG CAG GAC TAC TCC GGC AAC TTC CAC 
38970 38979 38988 

GGC GTC CTG ATG AGG CCG TTG AAG GTG 
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STLMGSRTGPLSAQIETG 
AP*CGAAPGPSRHRSRRV 
RQDVDRQPDRPAI GPDGY 

CGC GAC CAG TTG TAG GGC GAC GCC CAG GGC CCC TCG CTA CGG ACC TAG AGG CAT 
38997 39006 39015 39024 39033 39042 

GCG CTG GTC AAC ATC CCG CTG CGG GTC CCG GGG AGC GAT GCC TGG ATC TCC GTA 

ALVNIPLRVPGSDAWI SV 
RWSTSRCGSRGAMPGSPY 
AGQHPAAGPGERCLDLRT 

GCPYPPMWHTTALRI SP S 
GVPIRRCGTPRRWGSPRA 
GWLSVAADLPDDGVQHVP 

GGG GGT GTC CCT ATG CCG CCG TAG GTC ACC CAG CAG CGG TTG GAC TAC CTG CCC 
39051 39060 39069 39078 39087 39096 

CCC CCA CAG GGA TAC GGC GGC ATC CAG TGG GTC GTC GCC AAC CTG ATG GAC GGG 

PPQGYGGIQWVVANLMD G 
PHRDTAASSGSSPT * W T G 
PTGIRRHPVGRR QPDGRA 

SSSPWSTKRSPAGPLGAP 
APVRGRPRGAPHGPCGPR 
QQFEAVLDEQQTGRAARG 

GAC GAC CTT GAG CCG GTG CTC CAG AAG GAC GAC CCA CGG GGC CCG TCG GGC CGG 
39105 39114 39123 39132 39141 39150 

CTG CTG GAA CTC GGC CAC GAG GTC TTC CTG CTG GGT GCC CCG GGC AGC CCG GCC 

LLELGHEVFLLGAPGSPA 
CWNSATRSSCWVPRAARP 
AGTRPRGLPAGCPGQPGR 

RGPSVTT GAPSGSSISRH 
VGPASRRAPPRAPP SRAT 
SARPQGDHRRALRLLDLP 

CCT GCG GGC CCC GAC TGG CAG CAC GGC CGC CCG CTC GGC CTC CTC TAG CTC GCC 
39159 39168 39177 39186 39195 39204 

GGA CGC CCG GGG CTG ACC GTC GTG CCG GCG GGC GAG CCG GAG GAG ATC GAG CGG 

GRPGLTVVPAGEPEE I ER 
DARG*PSCRRASRRRSSG 
TPGADRRAGGRAGGDRAV 

SRVASTSTTWSWLPPTMP 
AASRPRRRPGRGCRRH* R 
PQPGRVDVHDVVVAATDD 



ACC GAC GCC TGG CGC CTG CAG CTG CAC CAG GTG CTG GTG TCG CCG CCA CAG TAG 
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39213 39222 39231 39240- 39249 39258 

TGG CTG CGG ACC GCG GAC GTC GAC GTG GTC CAC GAC CAC AGC GGC GGT GTC ATC 



WLRTADVDVVHDHSGGVI 
-GCGPRT S TWSTT T AAV S S 
AADRGRRRGPRPQRRCHR 

GAPSGGPVAKMLECWKVV 
GPRAAAPCRR**SAGS*W 
ARGPQRRAGGEDARVVEG 

CCG GGC CGG CCC GAC GGC GGC CCG TGG CGG AAG TAG TCG AGC GTG GTG AAG TGG 
39267 39276 39285 39294 39303 39312 

GGC CCG GCC GGG CTG CCG CCG GGC ACC GCC TTC ATC AGC TCG CAC CAC TTC ACC 

GPAGLPPGTAFI SSHHFT 
ARPGCRRAPPSSARTTSP 
PGRAAAGHRLHQLAPLHH 

RGTLGTPQV*LERACRAW 
GAP* GRPSYRCNGPAARG 
GPRDVGHATGVTGPRLAG 

TGG GCC GGC CAG TTG GGG CAC CCG ACA TGG ATG TCA AGG GCC CGC GTC GCG CGG 
39321 39330 39339 39348 39357 39366 

ACC CGG CCG GTC AAC CCC GTG GGC TGT ACC TAC AGT TCC CGG GCG CAG CGC GCC 

TRPVNPVGCTYS SRAQRA 
PGRS T PWAVPTVPGR SAP 
PAGQPRGLYLQFPGAARP 

QPPPSSAGTIGIGTSGAR 
SRPRRRRARSGS GPRGPA 
VAPAAVVRGHDR DRDVRR 

GTG ACG CCC CCG CCG CTG CTG CGC GGG CAC TAG GGC TAG GGC CAG CTG GGC CGC 
39375 39384 39393 39402 39411 39420 

CAC TGC GGG GGC GGC GAC GAC GCG CCC GTG ATC CCG ATC CCG GTC GAC CCG GCG 

HCGGGDDAPVIP IPVDPA 
TAGAATTRP*SRSRSTRR 
LRGRRRRARDPDPGRPGA 

*RDAASWTALSSKRSKMP 
SGTRRPGPPWPPSGAR*P 
AVPGGRVLHGLLVEQEEH 

GCG ATG GCC AGG CGG CGC CTG GTC CAC CGG TTC CTC CTG AAG GAC GAG AAG TAC 
39429 39438 39447 39456 39465 39474 

CGC TAC CGG TCC GCC GCG GAC CAG GTG GCC AAG GAG GAC TTC CTG CTC TTC ATG 

RYRSAADQVAKEDFLLFM 
ATGPPRTRWPRRTSCSSW 
LPVRRGPGGQGGLPALHG 

RT .JEGCLPASSAAANACAQ 
APRAACPPAPPPRTRARR 
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CCC GCC CAG AGC GGC GTG TTC CCC CGC GAC CTC CGC CGG CGC AAG CGC GTG CGG 
39483 39492 39501 3951 0 39 51 9 39 528 

GGG CGG GTC TCG CCG CAC AAG GGG GCG CTG GAG GCG GCC GCG TTC GCG CAC GCC 

GRVSPHKGALEAAAFAHA 
GGSRRTRGRWRRPRSRTP 
AGLAAQGGAGGGRVRARL 

PRRRTSAPGAQSGSYKS S 
RGAGPAPRARRPAPT SRR 
AAPAQHQGPGGPLRLVEV 

ACG CCG GCC GCG GAC CAC GAC CGG CCC GGG CGG ACC CTC GGC CTC ATG AAG CTG 
39537 39546 39555 39564 39573 39582 

TGC GGC CGG CGC CTG GTG CTG GCC GGG CCC GCC TGG GAG CCG GAG TAC TTC GAC 

CGRRLVLAGPAWEPEYFD 
AAGAWCWPGPPGSRSTST 
RPAPGAGRARLGAGVLRR 

IVRRYPEVTSGIPSTPPS 
S*EGTRS SRRASRHPPRR 

LDSAPVARGDLRDTLHAA 

CTC TAG TGA GCG GCC ATG CCG AGC TGG CAG CTC GGC TAG CCA CTC CAC CCG CCG 
39591 39600 39609 39618 39627 39636 

GAG ATC ACT CGC CGG TAC GGC TCG ACC GTC GAG CCG ATC GGT GAG GTG GGC GGC 

EITRRYGSTVEPI GEVGG 
RSLAGTARPSSRSVRWAA 
DHSPVRLDRRADR* GG RR 

RRS SRSAEACATSAMDWA 
AAARGARRRVRPAPWTGP 
LPPEVQEGGCVRHQGHGL 

CTC GCC GCC GAG CTG GAC GAG CGG AGG CGT GTG CGC CAC GAC CGG TAC AGG GTC 
39645 39654 39663 39672 39681 39690 

GAG CGG CGG CTC GAC CTG CTC GCC TCC GCA CAC GCG GTG CTG GCC ATG TCC CAG 

ERRLDLLASAHAVLAMSQ 
SGGSTCSPPHTRCWPCPR 
AAARPARLRTRGAGHVPG 

TV PGHPPMQHSGPAVTTE 
P*RATPRCRTRAPHSPPR 
RDGPRPAADPALRTRRHD 

CGC CAG TGG CCC GGC ACC CCG CCG TAG ACC ACG CTC GGC CCA CGC TGC CAC CAG 
39699 39708 39717 39726 39735 39744 

GCG GTC ACC GGG CCG TGG GGC GGC ATC TGG TGC GAG CCG GGT GCG ACG GTG GTC 

AVTGPWGGIWCEPGATVV 
RS JPGRGAASGASRVRRW S 
GHR AVGRHLVRAGCDGGL 
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SAATLPVGTTPVPLPQRA 
RPRRSRCERRPCPCRS GP 
GLGGHAASGDHARAVAAQ 

AGG CTC CGG CGG CAC TCG CCG TGA GGG CAG CAC CCG TGC CCG TTG CCG ACG GAC 
39753 39762 39771 39780 39789 39798 

TCC GAG GCC GCC GTG AGC GGC ACT CCC GTC GTG GGC ACG GGC AAC GGC TGC CTG 

SEAAVSGTPVVGTGNGCL 
PRPP*AALPSWARATAAW 
RGRRE. RHSRRGHGQRL PG 

SITGETPSTTPYPVSKAG 
RSRARPRRLRPIRCRSRA 
GLDHGRDAFDHSVAGVER 

CGG CTC TAG CAC GGG AGC CAG CCG CTT CAG CAC CCT ATG CCG TGG CTG AAG CGC 
39807 39816 39825 39834 39843 39852 

GCC GAG ATC GTG CCC TCG GTC GGC GAA GTC GTG GGA TAC GGC ACC GAC TTC GCG 

AE I VP S V GE VVGY GT D F A 
PRSCPRSAKSWDTAPT SR 
RDRALGRRSRGIRHRLRA 

S SARRVRAPSGAD S S T RR 
RR LVG S GPLAAPMRR P GA 
GVFCAPGQCPQRCGVLDP 

GGG CTG CTT CGT GCG GCC TGG GAC CGT CCC GAC GGC CGT AGG CTG CTC CAG GCC 
39861 39870 39879 39888 39897 39906 

CCC GAC GAA GCA CGC CGG ACC CTG GCA GGG CTG CCG GCA TCC GAC GAG GTC CGG 

PDEARRTLAGLPASDEVR 
PTKHAGPWQGCRHPTRSG 
RRSTPDPGRAAGIRRGPA 

AATRNHPWTVIASRYT SC 
HPPGTTPGHSSRRVTHPA 
TRRDPQPAMHRDGFP I HL 

GCA CGC CGC CAG GCC AAC ACC CCG GTA CAC TGC TAG CGG CTT GCC ATA CAC CTC 
39915 39924 39933 39942 39951 39960 

CGT GCG GCG GTC CGG TTG TGG GGC CAT GTG ACG ATC GCC GAA CGG TAT GTG GAG 

RAAVRLWGHVTIAERYVE 
VRRSGCGAM*RSPNGMWS 
C GGPVVGPCDDRRTV C GA 

YRLS SAPAVQFHPASARL 
TGCAAPRLSRSTLPRPGS 
LVAPQQGSRGPLSPGLGP 

GTC ATG GCG TCC GAC GAC CGG CCT CGC TGG ACC TTC ACT CCC CGG CTC CGG GCC 
39969 39978 39987 39996 40005 40014 

CAG TAC CGC AGG CTG CTG GCC GGA GCG ACC TGG AAG TGA GGG GCC GAG GCC CGG 
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STAGCWPERPGSEGPRPG 
VPQAAGRSDIiEVRGRGP E 

. PHVARAEARR* DKDLWPR 

RTSRGPRPVDDTRTWGPA 
APPGGPGRCTTLGQGALP 

TCG CCC ACC TGG CGG GCC CGG AGC CGT GCA GCA GTC AGG AAC AGG TCG GTC CCC 
40023 40032 40041 40050 40059 40068 

AGC GGG TGG ACC GCC CGG GCC TCG GCA CGT CGT CAG TCC TTG TCC AGC CAG GGG 

SGWTARASARRQSLS SQG 
AGGPPGPRHVVSPCPARG 
RVDRPGLGTSSVLVQPGA 

PEPDAVEEAAGMFVLVYA 
RSPTPSRKPRGWSSWCMP 
AARPRRGRRGGGHLGACL 

GCG CCG AGC CCC AGC CGC TGG AGA AGC CGG CGG GGG TAC TTC TGG TCG TGT ATC 
40077 40086 40095 40104 40113 40122 

CGC GGC TCG GGG TCG GCG ACC TCT TCG GCC GCC CCC ATG AAG ACC AGC ACA TAG 

RGSGSATSSAAPMKTST* 
AARGRRPLRPPP * R P A H R 
RLGVGDLFGRPHEDQH I G 

RRTQDTLNPGAYHPARLA 
GARRTPS IPART IRLACP 
GPADPRHSQPGRLASRAP 

CGG GCC GCG CAG ACC AGC CAC TCT AAC CCC GGG CGC ATT ACG CCT CGC GCG TCC 
40131 40140 40149 40158 40167 40176 

GCC CGG CGC GTC TGG TCG GTG AGA TTG GGG CCC GCG TAA TGC GGA GCG CGC AGG 

ARRVWSVRLGPA*CGARR 
PGAS GR *DWGPRNAERAG 
PARLVGE I GARVMRSAQ G 

HVVAEGSALPVPVGAAPD 
TCWPRVRPSPSPCGPPRT 
RAGRG* GLRPPRAGRRGP 

CGC ACG TGG TGC CGG AGT GGG CTC CGC TCC CCC TGC CCG TGG GGC CGC CGG CCC 
40185 40194 40203 40212 40221 40230 

GCG TGC ACC ACG GCC TCA CCC GAG GCG AGG GGG ACG GGC ACC CCG GCG GCC GGG 

ACTTASPEARGTGTPAAG 
RAPRPHPRRGGRAPRRPG 
VHHGLTRGEGDGHPGGRV 

VADTVLGRIRDDDD I HRH 
WRTP*WGGSVTTTTSTGT 
GGRRDGAGPYPRRRRHAP 



AGG TGG CGC AGC CAG TGG TCG GGG GCC TAT GCC AGC AGC AGC AGC TAC ACG GCC 
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402-39 40248 4025T 40266 40275 40284 

TCC ACC GCG TCG GTC ACC AGC CCC CGG ATA CGG TCG TCG TCG TCG ATG TGC CGG 



STASVTSPRIRSSSSMCR 
.PPRRSPAPGYGRRRRCAG 
HRV GHQPPDTVVVVDVP^ 

PLVPGLHAGPVYHLCGSI 
RCCPVSTRAPCMT CAAAT 
AAARSRPARRACLAPLRQ 

ACG CCG TCG TGC CCT GGC TCC ACG CGC GGC CCG TGT ATC ACG TCC GTC GGC GAC 
40293 40302 40311 40320 40329 40338 

TGC GGC AGC ACG GGA CCG AGG TGC GCG CCG GGC ACA TAG TGC AGG CAG CCG CTG 

CGSTGPRCAPGT*CRQPL 
AAARDRGARRAHSAGSRC 
RQHGTEVRAGHIVQAAA^ 

VTAEDLPTWISLGRRRCI 
WPPRTWRPGYAS GAGAAA 
GRHGRGAPDMHQ ARA P P L 

AGG TGC CAC CGG AGC AGG TCG CCC CAG GTA TAC GAC TCG GGC GCG GCC GCC GTC 
40347 40356 40365 40374 40383 40392 

TCC ACG GTG GCC TCG TCC AGC GGG GTC CAT ATG CTG AGC CCG CGC CGG CGG CAG 

STVASS SGVHML S PRRRQ 
PRWP RP AG S I C * ARA G G S 
HGGLVQRGPYAEPAPAAi 

PDMYGEDQHWPTAAGYN] 
RTWTARTRTGPRQRATTR 
AP GH L G R G PALA N GR R L E 

GCG CCC AGG TAC ATC GGG AGC AGG ACC ACG GTC CCG CAA CGG CGC GGC ATC AAG 
40401 40410 40419 40428 40437 40446 

CGC GGG TCC ATG TAG CCC TCG TCC TGG TGC CAG GGC GTT GCC GCG CCG TAG TTC 

RGSM*PSSWCQGVAAP*F 
AGPCSPRPGARALPRR SS 
RVHVALVLVPGRCRAVVI 

PKL I AHGYFDLEDEP IDI 
RS*FPTGMSTSSTRRSTW 
AAESHRAWLLRARGGPHG 

CCG CCG AAG TCT TAC CGC ACG GGT ATC TTC AGC TCG AGC AGG AGG CCC TAC AGG 
40455 40464 40473 40482 40491 40500 

GGC GGC TTC AGA ATG GCG TGC CCA TAG AAG TCG AGC TCG TCC TCC GGG ATG TCC 

GGFRMACP*KSSSSSGMS 
AASEWRAHRSRARPPGCP 
RLQNGVP IEVELVLRDVC 

L Q z A AIARCRQFHASEVLE 
CSRPSRGAGSSIRVRSWS 
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TCG TCG ACG CGC CGC TAG CGG GCC GTG GCG ACC TTT ACG CGT GAG AGC TGG TCG 
40509 40518 40527 40536 40545 40554 

AGC AGC TGC GCG GCG ATC GCC CGG CAC CGC TGG AAA TGC GCA CTC TCG ACC AGC 

SSCAAIARHRWKCALST S 
AAARRSPGTAGNAHSRPA 
QLRGDRPAPLEMRTLDQL 

PVFKEPRVIQPLRAPRD S 
PS SNRRACSRRYGPRGTP 
RPRIEGPARDATAPGAQR 

AGC CCC TGC TTA AAG AGG CCC GCG TGC TAG ACG CCA TCG GCC CGG CCG GAC AGC 
40563 40572 40581 40590 40599 40608 

TCG GGG ACG AAT TTC TCC GGG CGC ACG ATC TGC GGT AGC CGG GCC GGC CTG TCG 

SGTNFSGRTICGSRAGL S 
RGRI SPGARSAVAGPACR 
GDEFLRAHDLR*PGRPVG 

DQRGAI DFYDGTTFDAHE 
IRAAPST STTARLSTPT S 
FGPPRRHRLLRGYHLRRA 

CTT AGG ACC GCC GGC CGC TAC AGC TTC ATC AGC GGG CAT CAC TTC AGC CGC ACG 
40617 40626 40635 40644 40653 40662 

GAA TCC TGG CGG CCG GCG ATG TCG AAG TAG TCG CCC GTA GTG AAG TCG GCG TGC 

ESWRPAMSK*SPVVKSAC 
NPGGRRCRSSRP**SRRA 
ILAAGDVEVVARSEVGVL 

SFLRDYVGRLWELETDDV 
PSCAITSVACGSWSRTTW 
RLVPSRL CRAAVGAGHRG 

AGC CTC TTG TCC GCT AGC ATC TGT GGC GCG TCG GTG AGG TCG AGG CAC AGC AGG 
40671 40680 40689 40698 40707 40716 

TCG GAG AAC AGG CGA TCG TAG ACA CCG CGC AGC CAC TCC AGC TCC GTG TCG TCC 

SENRRS*TPRSHSSSVSS 
RRTGDRRHRAATPAP CRP 
GEQAIVDTAQPLQLRVVH 

LRPL SAFGDAQFAARH E E 
SGRCRHSDTPRSPQAT S R 
RAAAAIRIRRGPLSRPAG 

TGC TCG GCG CCG TCG CTA CGC TTA GGC AGC CGG ACC TTC CGA CGC GCC ACG AGG 
40725 40734 40743 40752 40761 40770 

ACG AGC CGC GGC AGC GAT GCG AAT CCG TCG GCC TGG AAG GCT GCG CGG TGC TCC 

TSRGSDANPSAWKAARCS 
R A : A A A M R IRRPGRLRGAP 
EPRQRCESVGLEGCAVLL 
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DIVTEVAGMRRSREDP (m) Q 
TS*LKWPGWVAAGKTLCK 
RRDCNGRGGYPPEKR * AN 

AGC AGC TAG TGT CAA AGG TGC CGG GGG TAT GCC GCC GAG GAA AGC AGT CCG TAA 
40779 40788 40797 40806 40815 40824 

TCG TCG ATC ACA GTT TCC ACG GCC CCC ATA CGG CGG CTC CTT TCG TCA GGC ATT 

SSITVSTAPIRRLLSSGI 
RRSQFPRPPYGGSFRQAF 
VDHSFHGPHTAAPFVRHL 

PSRYTGGRFIADAKAP SY 
LHVIREEGSYPMPKLRL I 
STFSVNRGPIHCRS*GSF 

ACT CCA CTT GCT ATG CAA GGA GGG GCC TTA TAC CGT AGC CGA AAT CGG CCT CTT 
40833 40842 40851 40860 40869 40878 

TGA GGT GAA CGA TAC GTT CCT CCC CGG AAT ATG GCA TCG GCT TTA GCC GGA GAA 

*GERYVPPRNMASALAGE 
EVNDTFLPGIWHRL* PEN 
R*TIRSSPEYGIGFSRRI 

•HI S *VRAPLPSDMAT PRR 

TFQS SEQRYRHIWPRRAA 
LSNVLSKGTATFGHGDPP 

ATC ACT TAA CTG ATC TGA GAA CGG CCA TCG CCA CTT AGG TAC CGG CAG CCC GCC 
40887 40896 40905 40914 40923 40932 

TAG TGA ATT GAC TAG ACT CTT GCC GGT AGC GGT GAA TCC ATG GCC GTC GGG CGG 

**ID*TLAGSGESMAVGR 
SELTRLLPVAV NPWP SGG 
VN*LDSCR*R*IHGRRAA 

EWQ. HAHLVRPAVYT FYP L 
SGNI RTYYERRSTHL I RS 
AGMSART I SEARR IYFVP 

GCG AGG GTA ACT ACG CGC ACA TTA TGA GAG CCG CGC TGC ATA CAT TTT ATG CCC 
40941 40950 40959 40968 40977 40986 

CGC TCC CAT TGA TGC GCG TGT AAT ACT CTC GGC GCG ACG TAT GTA AAA TAC GGG 

RSH* CACNTLGATYVKYG 
APIDARVILSARRM*NTG 
LPLMRV*YSRRDVCK IRE 

PNSHSSVTRNRQIDSADD 
RTAI VPCLAIANSTPPTM 
A P Q * SQVCHSQTPHRLR* 

TCG CCC AAC GAT ACT GAC CTG TGT CAC GCT AAC GCA ACC TAC AGC CTC CGC AGT 
40995 41004 41013 41022 41031 41040 

AGC GGG TTQ CTA TGA CTG GAC ACA GTG CGA TTG CGT TGG ATG TCG GAG GCG TCA 
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S G L Ii L ' D- T V R L R V\T M " S E A S 

A G C DWTQCDC VGCRRRH 

R V A (m) tg hsaialdvggv: 



VVVLREFQSPKLPGEVKI 
**SSGKSSAQS*PVKSRA 
RSRRAKRVPKAEPSRRGQ 

AGA TGA TGC TGC TCG GAA AGC TTG ACC GAA CCG AAG TCC CCT GGA AGC TGG AAC 
41049 41058 41067 41076 41085 41094 

TCT ACT ACG ACG AGC CTT TCG AAC TGG CTT GGC TTC AGG GGA CCT TCG ACC TTG 

STTT SLSNWLGFRGP STL 
LLRRAFRTGLASGDLRPC 
YYDEPFELAWLQGTFDLi 

DGSIRTNGEAIEDLVGL 1 : 
TVAS G LTVRRSKMS S VSR 
P*RQDSH*GGRN*RPCRA 

GCC AGT GGC GAC TAG GCT CAC AAT GGG AGG CGC TAA AGT AGC TCC TGT GGC TCG 
41103 41112 41121 41130 41139 41148 

CGG TCA CCG CTG ATC CGA GTG TTA CCC TCC GCG ATT TCA TCG AGG ACA CCG AGC 

RSPL IRVLPSAISSRTPS 
GHR* SECYPPRFHRGHRA 
VTADPSVTLRDFIEDTEI 

EIQVPFRRRLSRANE RR( 
K * R S PFVGASRGPMREEA 
NRDPRS FAPPAVPCERKP 

CAA AGA TAG ACC TGC CCT TTT GCG GCC GCC TCG CTG GCC CGT AAG AGA GAA GCC 
41157 41166 41175 41184 41193 41202 

GTT TCT ATC TGG ACG GGA AAA CGC CGG CGG AGC GAC CGG GCA TTC TCT CTT CGG 

VSIWTGKRRRSDRAF SLR 
FLSGRENAGGATGHS LFG 
FYLDGKTPAERPGI L SSi 

RGVLAPDPN SPGPP FQG3 
AAS S LQTRTRRAQRS SAW 
LPRR SSPGPEVPRAPVPG 

GTC GCC GGC TGC TCT CGA CCC AGG CCC AAG CTG CCC GGA CCG CCC TTG ACC GGG 
41211 41220 41229 41238 41247 41256 

CAG CGG CCG ACG AGA GCT GGG TCC GGG TTC GAC GGG CCT GGC GGG AAC TGG CCC 

QRPTRAGSGFDGPGGNWP 
SGRRELGPGST-GLAGTGP 
AADE SWVRVRRAWRE LAC 

LNRTRNRRDRGEGAFHRI 
SIGP EIAATVARARS IGV 
PSEQNSQPP*PGRGRFAS 

TCC TCT AAG GAC CAA GCT AAC GCC GCC AGT GCC GGG AGC GGG CGC TTT ACG GCT 
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41 265 4T2T4 41283 4T292' 41301 41310 

AGG AGA TTC CTG GTT CGA TTG CGG CGG TCA CGG CCC TCG CCC GCG AAA TGC CGA 



RRFLVRLRRSRPSPAKCR 
GDSWFDCGGHGPRPRNAD 
E IPGS IAAVTALAREMP T 

RHDRI LRGLAGVYERFP P 
VTTAF*GGSHASTSASHP 
SPPRSDAARTRRR VRP I p 

GCT GCC ACC AGC GCT TAG TCG GCG GGC TCA CGC GGC TGC ATG AGC GCC TTA CCC 
41319 41328 41337 41346 41355 41364 

CGA CGG TGG TCG CGA ATC AGC CGC CCG AGT GCG CCG ACG TAC TCG CGG AAT GGG 

RRWSRI SRPSAPTYSRNG 
DGGRE SAARVRRRTRGMG 
TVVANQPPECADVLAEWG 

QGGDQLRHDEVAEFPDGL 
SVATRSVTTRSQKSPTAL 
ASRRGPSPPGRSSRLPRW 

CCG ACT GGC GGC AGG ACC TCT GCC ACC AGG AGC TGA CGA AGC TTC CCC AGC GGT 
41373 41382 41391 41400 41409 41418 

GGC TGA CCG CCG TCC TGG AGA CGG TGG TCC TCG ACT GCT TCG AAG GGG TCG CCA 

G*PPSWRRWSSTASKGSP 
ADRRPGDGGPRLLRRGRQ 
LTAVLETVVLDCFE GVAK 

GIGPQQADGQGPEAPGGA 
GSGRSSPMARARSPRGGP 
ARDGAAP CRGPGAR GA GR 

TCG GGC TAG GGG CCG ACG ACC CGT AGC GGG ACC GGG CCG AGC CGG CCG GGG GGC 
41427 41436 41445 41454 41463 41472 

AGC CCG ATC CCC GGC TGC TGG GCA TCG CCC TGG CCC GGC TCG GCC GGC CCC CCG 

SPIPGCWASPWPGSAGPP 
ARSPAAGHRPGPARPAPR 
PDPRLLGIALARLGRPPG 

LQQHHAVADVVVHCGGTG 
SSSTTPLRTSWSTAGARE 
RAAPPPCGRRGRRPVRGN 

CGC TCG ACG ACC ACC ACC CGT TGG CGC AGC TGG TGC TGC ACC GTG GGC GGG CAA 
41481 41490 41499 41508 41517 41526 

GCG AGC TGC TGG TGG TGG GCA ACC GCG TCG ACC ACG ACG TGG CAC CCG CCC GTT 

AS CWWWATAST TTWH P PV 
RAAGGGQPRRPRRGTRPF 
ELLVVGNRVDHDVAPARS 

QA : _ARRHEYQRLVAVAPWR 
RPQGATNTSGSSP*RLGG 
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GGG ACC CGA CGG GCC GCC ACA AGC ATG ACG GCC TCC TGC CGA TGG CGT CCG GTG 
41535 41544 41553 41562 41571 41580 

CCC TGG GCT GCC CGG CGG TGT TCG TAC TGC CGG AGG ACG GCT ACC GCA GGC CAC 

PWAARRCSYCRRTATAGH 
PGLPGGVRTAGGRLPQAT 
LGCPAVFVLPEDGYRRpp 

ADMRVEGPGVAGQARDTG 
PTWGSRVRA*RARRATRV 
PRGDPG*GPRGRGARPGY 

GCC CGC AGG TAG GCC TGG AGT GGG CCC GGA TGG CGC GGG ACG CGC GCC AGG CAT 
41589 41598 41607 41616 41625 41634 

CGG GCG TCC ATC CGG ACC TCA CCC GGG CCT ACC GCG CCC TGC GCG CGG TCC GTA 

RASIRTSPGPTAPCARSV 
GRPSGPHPGLPRPARGPY 
G VHPDL TRAYRALRAVR T 

HRRPVVHRPDGGEGVQGR 
TGGP S S TGRTAERA SRAA 
RAEPPRRAAPRRGRRGPR 

GGC ACG GAG GCC CCC TGC TGC ACG GCG CCC AGC GGA GGG AGC GGC TGG ACC GGC 
41643 41652 41661 41670 41679 41688 

CCG TGC CTC CGG GGG ACG ACG TGC CGC GGG TCG CCT CCC TCG CCG ACC TGG CCG 

PCLRGTTCRGSPPSPTWP 
RASGGRRAAGRLPRRPQR 
VPPGDDVPRVASLADLAA 

RGQRAETRQSWPPGAARP 
DGRARRPASHGRRVQQGP 
TAGPAGRHATVVASRSGP 

GCA GCG GGG ACC GCG CGG AGC CAC GCG ACA CTG GTG CCG CCT GGA CGA CGG GCC 
41697 41706 41715 41724 41733 41742 

CGT CGC CCC TGG CGC GCC TCG GTG CGC TGT GAC CAC GGC GGA CCT GCT GCC CGG 

RRPWRASVR C_ DHGGPAAR 
VAPGAPRCA (v) TTADLLPG 
SPLARLGAL*PRRTCCPG 

< ^> 

GYPPSRPSPN*RIGASPW 
VTRRHDPRRTED SGPQ --R G 
SRVAT I PAVPKMPDRSVA 

CCT GGC ATG CCG CCA CTA GCC CCG CTG CCC AAA GTA GCC TAG GGC CGA CTG CCG 
41751 41760 41769 41778 41787 41796 

GGA CCG TAC GGC GGT GAT CGG GGC GAC GGG TTT CAT CGG ATC CCG GCT GAC GGC 

GPYGGDRGDGFHRI PAD G 
D R " „T A V I GATGF I G S R L T A 
TVRR*SGRRVSSDPG*RP 
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A*RQRGARAPRR*GPTGi 
PEGSVARARRGGEVPRER 
LSVASPGRAGAAKLRANG 

GTC CGA GTG GCG ACT GCC GGG CGC GCG CGG CCG GCG GAA GTT GGC CCG CAA GGG 
41805 41814 41823 41832 41841 41850 

CAG GCT CAC CGC TGA CGG CCC GCG CGC GCC GGC CGC CTT CAA CCG GGC GTT CCC 

QAHR*RPARAGRLQPGVP 
RLTADGPRAPAAFNRAFP 
GSPLTARARRPPSTGRSI 

PPRRGPRGPVPPPRCRR< 
RHDAAPGGRSQRLGVDDV 
GTTPPRAAGPSASASMT * 

CGG CCA CCA GCC GCC GGC CCG GCG GGG CCC TGA CCG CCT CCG GCT GTA GCA GAT 
41859 41868 41877 41886 41895 41904 

GCC GGT GGT CGG CGG CCG GGC CGC CCC GGG ACT GGC GGA GGC CGA CAT CGT CTA 

AGGRRPGRPGTGGGRHRL 
PVVGGRAAPGLAEAD IVY 
RWSAAGPPRDWRRPTS S r . 

GPR RG * DPGRRVDAR GP1 
EQGGAETRDEGFTPGVQD 
KRAAPRL GTRASR .RG S R T 

GAA GGA CCG GCG GCC GGA GTC AGG CCA GGA GCG GCT TGC AGC CGG GCT GGA CCA 
41913 41922 41931 41940 41949 41958 

ctt cct ggc cgc cgg cct cag tcc ggt cct cgc cga acg tcg gcc cga cct ggt 

lpgrrpqsgprrtsarpg 
fiiaa gl spvlaerrpd lv 
swppasvrsspnvgpt'w* 

prvgvaprpappatwlp^ 
lgfasqqdlhqlrqgsrs 
sasrrsststssasdlap 

gct ccg gct tgc ggc tga cga cca gct cca cga cct ccg cga cag gtc tcg ccc 

41967 41976 41985 41994 42003 42012 

CGA GGC CGA ACG CCG ACT GCT GGT CGA GGT GCT GGA GGC GCT GTC CAG AGC GGG 

RGRTPTAGRGAGGAVQSG 
EAERRLLVEVLEALSRAG 
RPNADCWSRCWRRCPERI 

GGPT RVPWSPRPPRRAR] 
VARHEYQGARAPRDVRGL 
CRGTNTSALEPPAT * A G S 

TGT GGC GGG CCA CAA GCA TGA CCG GTC GAG CCC GCC CCG CCA GAT GCG CGG GCT 
42021 42030 42039 42048 42057 42066 

ACA CCG CGG GGT GTT CGT ACT GGC CAG CTC GGG CGG GGC GGT CTA CGC GCC CGA 
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HRPVFVLASSGGAVYAP; 
TARCSYWPARAGRS TRP 



RVATGP SWGSGARS RRRj 
DFRRVPLGARGPGVGDVP 
TSGGYRSVLGVRGSET * P 

CCA GCT TGG CGG CAT GGC CCT CTG GTC GGG CTG GGC CGG GCT GAG GCA GAT GCC 
42075 42084 42093 42102 42111 42120 

GGT CGA ACC GCC GTA CCG GGA GAC CAG CCC GAC CCG GCC CGA CTC CGT CTA CGG 

GRTAVPGDQPDPARLRLR 
VEPPYRETSPTRPD SVYG 
SNRRTGRPARPGPTPST( 

RWAGGRVRATGASPHRG1 
VGLEAE FALQAPVR I GDT 
CALSRRSRSSHRCE SATR 

CGT GCG GTT CGA GGC GGA GCT TGC GCT CGA CAC GGC CGT GAG CCT ACG GCA GGC 
42129 42138 42147 42156 42165 42174 

GCA CGC CAA GCT CCG CCT CGA ACG CGA GCT GTG CCG GCA CTC GGA TGC CGT CCG 

ARQAPPRTRAVPAL GCRP 
HAKLRLERELCRHS DAVR 
TPSSASNASCAGTRMPS^ 

RPRAT S CHRRDRGARGA3 
GHDRPQAIDVTGALAGQA 
ATTARNLLT*PGPWRARR 

ACG GCA CCA GCG CGC CAA CTC GTT ACA GAT GCC AGG GCC GGT CGC GCG GGA CGC 
42183 42192 42201 42210 42219 42228 

TGC CGT GGT CGC GCG GTT GAG CAA TGT CTA CGG TCC CGG CCA GCG CGC CCT GCG 

CRGRAVEQCLRSRPARPA 
AVVARL SNVYGPGQRALR 
PWSRG* AMSTVPASAPCi 

TRHAAASASPPRGPRAR2 
PETHQRVPQRRG GPALGH 
PNPTSGCQSVAAARPSGT 

GCC CAA GCC ACA CGA CGG CGT GAC CGA CTG CCG CCG GCG GGC CCC GCT CGG GCA 
42237 42246 42255 42264 42273 42282 

CGG GTT CGG TGT GCT GCC GCA CTG GCT GAC GGC GGC CGC CCG GGG CGA GCC CGT 

RVRCAAALADGGRP GRAR 
GFGVLPHWLTAAARGEPV 
GSVCCRTG*RRPPGASPC 

PTRRDAHPGPSHGRRRR* 
PHEAIRMHDPVIDVDVVD 

RTNPSGCTTRS*TWTSST 

- _ 

CGC CCA CAA GCC GCT AGG CGT ACA CCA GGC CCT GAT ACA GGT GCA GCT GCT GCA 
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42291 . 42300 42309 423T8 42327 42336 

GCG GGT GTT CGG CGA TCC GCA TGT GGT CCG GGA CTA TGT CCA CGT CGA CGA CGT 



AGVRRSACGPGLCPRRRR 
RVF GD P HVVRDYVHV D D V 
GCSAIRMWSGTMSTSTTS 

GTGARAARGPRRRGAAR R 
GPEQERQAAPDAAAPQ GG 
VRNRSASRPRTPPPRSGA 

GTG GGC CAA GGA CGA GCG CGA CGC GCC GGC CCA GCC GCC GCC GGC CGA CGG GCG 
42345 42354 42363 42372 42381 42390 

CAC CCG GTT CCT GCT CGC GCT GCG CGG CCG GGT CGG CGG CGG CCG GCT GCC CGC 

HPVPARAAR PGR RRPAAR 
TRFLLALRGRVGGGRL PA 
PGSCSRCAAGSAAAGCPP 

P SRR S PRAWKASRGAP SR 
HHVDARAH GSRQAAQQLD 
TTFTPEPTGVESLP R S S I 

GCA CCA CTT GCA GCC GAG CCC GCA CGG GTG AAG CGA CTC GCC GGA CGA CCT CTA 
* 42399 42408 42417 42426 42435 42444 

CGT GGT GAA CGT CGG CTC GGG CGT GCC CAC TTC GCT GAG CGG CCT GCT GGA GAT 

RGERRLGRAHFAERPAGD 
VVNVGSGVPTSLSGLLE I 
W*TSARACPLR* AACWRS 

TRHSRRSRRPASPAPVTR 
HGTHGAAGDRHAPLPSPG 
TDPTVPPETATRQSRPRD 

GCA CAG GCC ACA CTG GCC GCC GAG GCA GCG CCA CGC GAC CCT CGC CCC TGC CAG 
42453 42462 42471 42480 42489 42498 

CGT GTC CGG TGT GAC CGG CGG CTC CGT CGC GGT GCG CTG GGA GCG GGG ACG GTC 

RVRCDRRLRRGALGAGTV 
VSGVTG GSVAVRWERGRS 
C P V * PAAPSRC AGSGD GP 

RGAP C S APHRVP GRRVR S 
EVPLAVPQIDCPGAGFEV 
KSRCPLQSSTARARASSS 

GAA GCT GGC CGT CCC GTT GAC CGA CCT ACA GCG TGC CCG GGC GCG GCT TGA GCT 
42507 42516 42525 42534 42543 42552 

CTT CGA CCG GCA GGG CAA CTG GCT GGA TGT CGC ACG GGC CCG CGC CGA ACT CGA 

LRPAGQLAGCRTGPRRTR 
FDRQ GNWLDVARARAE LD 
STGRATGWMS HGPAPNST 

A P ,JR WGGSRPHGATSPAHA 
PPGGDGQGLTDPLAPL, TH 
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GAC CGC CCG GCG GTA GGG GGA CTG GCT CCC ACA GGC CGT CAC GAC CCT CGC ACA 
42561 42570 42579 42588 42597 42606 

CTG GCG GGC CGC CAT CCC CCT GAC CGA GGG TGT CCG GCA GTG CTG GGA GCG TGT 

LAGRHPPDRGCPAVLGAC 
WRAA I PLTEGVRQCWER V 
6GPPSP*P-RVSGSAGSVC 

GRRRGPGKRRSASSP*v-R 
EVVGAPGRGGRRALRDSA 
SWSAPRAGEAEVR*VTLR 

CGA GGT GCT GCG GCC GGC CCG GGG AAG GCG GAG CTG CGC GAT CTG CCA GTC TGC 
42615 42624 42633 42642 42651 42660 

GCT CCA CGA CGC CGG CCG GGC CCC TTC CGC CTC GAC GCG CTA GAC GGT CAG ACG 

APRRRPGPFRLDALDGQT 
LHD AGRAPSASTR* TVRR 

STTPAGPL PPRRARRSDA 

*VTLRTLRMRPRLSAPSW 
NSP*VR*VCGRV SRHRAG 
TLRD SADSADASPAI GPE 

GCA ATC TGC CAG TCT GCG CAG TCT GCG TAG GCG CCT GCC TCG CTA CGG CCC GAG 
42669 42678 42687 42696 42705 42714 

CGT TAG ACG GTC AGA CGC GTC AGA CGC ATC CGC GGA CGG AGC GAT GCC GGG CTC 

R*TVRRVRRIRGRSDAGL 
VRR S DASDA SA D GAMP GS 
LDGQTRQTHPRTERCRAP 

GR,VWRTTFGPMLAT I LAQ 
GEYGGLPSARC*RQS *PR 
VR T G V S HHL GADV S H D P G 

GTG GGA GCA TGG GTG GCT CAC CAC TTC GGG CCG TAG TTG CGA CAC TAG TCC CGG 
42723 42732 42741 42750 42759 42768 

CAC CCT CGT ACC CAC CGA GTG GTG AAG CCC GGC ATC AAC GCT GTG ATC AGG GCC 

HPRTHRVVKPGI N A V IRA 
TLVPTE W*SPASTL* SGP 
PSYPPSGEARHQRCD Q G L 

VPRNGADPQDGPLSGHRP 
SRGI GLTPSTVLYLGTAP 
PGASEWRRAP*WTSVRPP 

ACC TGG CCG GCT AAG GGT CGC AGC CCG ACC AGT GGT CCA TCT CTG GGC ACC GCC 
42777 42786 42795 42804 42813 42822 

TGG ACC GGC CGA TTC CCA GCG TCG GGC TGG TCA CCA GGT AGA GAC CCG TGG CGG 

WTGRFPASG W SPGRDPWR 
GP^ D S Q RRA GHQ V E T R G G 
DRPI PSVGLVTR*RPVAG 
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RLPRPRGDQRSG RQGTRR 
DYLDHADMKGPAESVPAA 
TTSTTPTWRAPLRASRHP 

CCA GCA TCT CCA GCA CCC GCA GGT AGA ACG GCC CTC GGA GCG ACT GGC CAC GCC 
42831 42840 42849 42858 42867 42876 

GGT CGT AGA GGT CGT GGG CGT CCA TCT TGC CGG GAG CCT CGC TGA CCG GTG CGG 

GRRGRGRPSCREPR* PVR 
VVEVVGVHLAGSLADRCG 
S*RSWASILPGASLTGAA 

ADRGGGDFPRERGGRAVP 
PMGAAAMLRANEAAALLQ 
PCGPRRW*VPTRPRRSCS 

GCC CGT AGG GCC GGC GGC GGT AGT TTG CCC GCA AGA GCC GGC GGC GCT CGT TGA 
42885 42894 42903 42912 42921 42930 

CGG GCA TCC CGG CCG CCG CCA TCA AAC GGG CGT TCT CGG CCG CCG CGA GCA ACT 

RASRPPP SNGRSRPPRAT 
GHPGRRHQTGVLGRREQL 
G I P A A A I KRAFSAAASNW 

PRLQGGAPRRGPRAGA PR 
RVSNDE P LADAQAHAQQA 
ASPTTRRCPTPRPTRRSP 

CCG CCT GCC TCA ACA GGA GGC CGT CCC GCA GCC GGA CCC GCA CGC GGA CGA CCC 
42939 42948 42957 42966 42975 42984 

GGC GGA CGG AGT TGT CCT CCG GCA GGG CGT CGG CCT GGG CGT GCG CCT GCT GGG 

GGRSCPPAGRRPGRAP AG 
ADGVVLRQGVGLGVRLLG 
RTEL S S GRASAWACACWA 

PGRAHRHRRRPHR GTGRG 
RDEHTGTVADHIDALGAV 
ATRTRAP SPTTSTPWDRS 

GCG CCA GGA GCA CGC ACG GCC ACT GCC GCA GCA CCT ACA GCC GGT CAG GGC GCT 
42993 43002 43011 43020 43029 43038 

CGC GGT CCT CGT GCG TGC CGG TGA CGG CGT CGT GGA TGT CGG CCA GTC CCG CGA 

RGPRACR*RRRGCRPVPR 
AVLVRAGDGVVDVGQ SRD 
RSSCVPVTASWMSASPAT 

TRRLGGRRRGARVRGHRA 
LEAFAV AGDVQEYEATAR 
WNPSPWRATSRSTSPRPA 

GGT CAA GCC GCT TCC GGT GGC GCG GCA GCT GGA CGA GCA TGA GCC GGC ACC GCG 
43047 43056 43065 43074 43083 43092 

CCA GTT CGG CGA AGG CCA CCG CGC CGT CGA CCT GCT CGT ACT CGG CCG TGG CGC 
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QFGEGHRAVDLLVLGRGA 
SSAKATAPSTCSYSAVAR 

GPDDRRGARLLRGQRGTA 
EPTMADALEFYAAKGAQQ 
SRP*RTPWSSTPPRAPRN 

CGA GGC CCC AGT AGC GCA GCC GGT CGA GCT TCA TCC GCC GGA ACG GCC GGA CAA 
43101 43110 43119 43128 43137 43146 

GCT CCG GGG TCA TCG CGT CGG CCA GCT CGA AGT AGG CGG CCT TGC CGG CCT GTT 

APGSSRRPARSRRPCRPV 
LRGHRVGQLEVGGLAGLL 
SGVIASASSK* AALPACC 

PVRRVGPHVAAPLRQP LA 
QYVGSVLTFLRQYANRYL 
STCAPCWPSCGSTPTATS 

CGA CCA TGT GCG GCC TGT GGT CCC ACT TGT CGG CGA CCA TCC GCA ACG CCA TCT 
43155 43164 43173 43182 43191 43200 

GCT GGT ACA CGC CGG ACA CCA GGG TGA ACA GCC GCT GGT AGG CGT TGC GGT AGA 

AGTRRTPG*TAAGRRCGR 
LVHAG HQGEQFLVGVAVE 
WYTPDTRVNSRW*ALR* S 

VRLVGRGGGGHRGQE GHR 
SEYFAGAEEETVDKN VTA 
RSTSRGPRRRRSTRT * R P 

CGC TGA GCA TCT TGC GGG GCC GGA GGA GGA GGC ACT GCA GGA ACA AGT GGC ACC 
43209 43218 43227 43236 43245 43254 

GCG ACT CGT AGA ACG CCC CGG CCT CCT CCT CCG TGA CGT CCT TGT TCA CCG TGG 

ATRRTPRPPPP*RPCSPW 
RLVERPGLLLRDVLVHRG 
DS*NAPASSSVTSLFTVA 

ARVDRGAHRQLAGPP RRH 
LVSTAALMGSYLALHVGT 
SCPRRPWCAATSRWTSAP 

GCT CGT GCC TGC AGC GCC GGT CGT ACG GCG ACA TCT CGC GGT CCA CCT GCG GCC 
43263 432^2 43281 43290 43299 43308 

CGA GCA CGG ACG TCG CGG CCA GCA TGC CGC TGT AGA GCG CCA GGT GGA CGC CGG 

RARTSRPACRCRAPGGRR 
EHGRRGQHAAVERQVDAG 
STDVAASMPL*SARWTPV 

VAAPRPLLRRRRRPLLRP 
SLLPDLFCAADGALYYGP 
PCCRTSSAPPTAPSTTAP 

•* w ' — 

ACC TGT CGT CGC CCA GCT CCT TCG TCC GCC GCA GCG GCC GCT CCA TCA TCG GCC 
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43317 43326 43335 43344 43353 " 43362 

TGG ACA GCA GCG GGT CGA GGA AGC AGG CGG CGT CGC CGG CGA GGT AGT AGC CGG 



WTAAGRGSRRRRRRGS SR 
• GQQRVEEAGGVAGEVVAG 
DSSGSRKQAASPAR* * PC 

RPLQRRRLLLGAGGTRGJ 
GHFSDAVYSFDQEVRVGP 
ATSATP STPSTRSWGYAR 

CCG GCA CCT TCG ACA GCC GCT GCA TCC TCT TCA GGA CGA GGT GGG CAT GCG GGC 
43371 43380 43389 43398 43407 43416 

GGC CGT GGA AGC TGT CGG CGA CGT AGG AGA AGT CCT GCT CCA CCC GTA CGC CCG 

GRGSCRRRRRSPAPPVRP 
AVEAVGDVGEVLLHPYAR 
PWKLSAT*EKSCSTRTP< 

PLRREGHPRARDPIGRGi 
QYVGNAMLDRVTPSEEVL 
S TSATRWSTACPRPNRSW 

CGA CCA TCT GCG GCA AGC GGT ACT CCA GCG CGT GCC AGC CCC TAA GGA GCT GGT 
43425 43434 43443 43452 43461 43470 

GCT GGT AGA CGC CGT TCG CCA TGA GGT CGC GCA CGG TCG GGG ATT CCT CGA CCA 

AGRRR S P * GRAR S G I P R P 
LVDAVRHEVAHGRGF LDQ 
W*TPFAMRSRTVGDS ST* 

LGADGGPRRTGPPAGPV] 
SALMAE LDAHERRRE L FR 
RPWCRRWTPTNGAASWSG 

CGC TCC GGT CGT AGC GGA GGT CCA GCC GCA CAA GGG CCG CCG CGA GGT CCT TGG 
43479 43488 43497 43506 43515 43524 

GCG AGG CCA GCA TCG CCT CCA GGT CGG CGT GTT CCC GGC GGC GCT CCA GGA ACC 

ARPAS P PGRRVPGGAP GT 
RGQHRLQVGVFPAALQEP 
EAS I A SRSACSRRRS RN I 

GPPLRFRRQVPGRAAPDC 
DQHCVFGVSYRDGRLP IV 
TRTAS SVSATGTG ACR S * 

CCA GGA CCA CCG TCT GCT TTG GCT GCG ACA TGG CCA GGG GCG CGT CGC CCT AGT 
43533 43542 43551 43560 43569 43578 

GGT CCT GGT GGC AGA CGA AAC CGA CGC TGT ACC GGT CCC CGC GCA GCG GGA TCA 

GPGGRRNRRCTGPRAAGS 
VLVAD E TDAVPVPAQRDH 
SWWQTKPTLYRSPR SGI1 

L V R G P R Q H R Q H G R H A F C 

WYWGDPASIVNIGGTPSS 
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GGG TCA TGG TCG GCA GGC CCC GCG ACT ACT GCA ACT ACG GGG GAC ACC CGC TTG 
43587 43596 43605 43614 43623 43632 

CCC AGT ACC AGC CGT CCG GGG CGC TGA TGA CGT TGA TGC CCC CTG TGG GCG AAC 

PSTSRPGR**R*CPLWAN 
PVPAVRGADDVDAPCGRT 
QYQPSGALMTLMPPVGEL 

AAALRGALLGLDRRQPLD 
PLLSGGQWYGWIAVNRFI 
PCC RAARGTAGSRSTAS S 

ACC CGT CGT CGC TCG GCG GGA CGG TCA TCG GGG TCT AGC GCT GCA ACG CCT TCT 
43641 43650 43659 43668 43677 43686 

TGG GCA GCA GCG AGC CGC CCT GCC AGT AGC CCC AGA TCG CGA CGT TGC GGA AGA 




AGA GCA CGC CCG CCG CCA AGA AGT CCA CGA ACC TCT ACT GCG GCC GGG CCG GGC 
43695 43704 43713 43722 43731 43740 

TCT CGT GCG GGC GGC GGT TCT TCA GGT GCT TGG AGA TGA CGC CGG CCC GGC CCG 

SRA GGGS SGAWR*RRPGP 
LVRAAVLQVLGDDAGPAR 
SCGRRFFRCLEMTPARPE 

RRHRLRVGRQGA*RHRPG 
ADIVYDFEESVLEGTDPD 
PTSSTTSSRASWSVPTPT 

TCC GCA GCT ACT GCA TCA GCT TGA GGA GCG ACT GGT CGA GTG GCC ACA GCC CCA 
43749 43758 43767 43776 43785 43794 

AGG CGT CGA TGA CGT AGT CGA ACT CCT CGC TGA CCA GCT CAC CGG TGT CGG GGT 

RRR*RSRTPR*PAHR CRG 
GVDDVVE LLADQLT GVGV 
ASMT*SNSSLTSSPVSGS 

AVGGWGRPRRRVARAQGH 
LWEAGAARDGDFLVRKVT 
WGSRGLRATATSCCASSR 



GGT CGG TGA GGC GGG GTC GGC GCG CCA 
43803 43812 43821 

CCA GCC ACT CCG CCC CAG CCG CGC GGT 



GCG GCA GCT TGT CGT GCG CGA ACT GGC 
43830 43839 43848 

CGC CGT CGA ACA GCA CGC GCT TGA CCG 




RGRHRRRGAQGREEPARP 
VGETVDAGQKVANKLLVH 
SARPSTPARSSR TR* SCT 

ACT GCG GGA GCC ACT GCA GCC GCG GGA CGA ACT GGC GCA AGA AGT CCT CGT GCA 
43857 43866 43875 43884 43893 43902 

TGA CGC CCT CGG TGA CGT CGG CGC CCT GCT TGA CCG CGT TCT TCA GGA GCA CGT 

*RPR*RRRPA*PRS S GAR 
DA'LGDVGALLDRVLQEHV 
TPSVTSAPCLTAFFRSTW 

RLRRPRGALLPRRSRLDE 
DFDDRDVQWSRVDPGF I K 
TSTTATSRGPASTPVSSR 

CCA GCT TCA GCA GCG CCA GCT GGA CGG TCC TCG CCT GCA GCC CTG GCT TCT AGA 
43911 43920 43929 43938 43947 43956 

GGT CGA AGT CGT CGC GGT CGA CCT GCC AGG AGC GGA CGT CGG GAC CGA AGA TCT 

GRSRRGRPARSGRRDRR S 
VEVVAVDLPGADVGT ED L 
SKSSRSTCQERTSGPK I F 

ALRDGLGGQGLAAARREQ 
PWD IAWDEKGWRLLVGNK 
RGT SRGTRRAGACCCATR 

AGC CGG TCA GCT AGC GGG TCA GGA GGA ACG GGG TCG CGT CGT CGT GCG GCA AGA 
43965 43974 43983 43992 44001 44010 

TCG GCC AGT CGA TCG CCC AGT CCT CCT TGC CCC AGC GCA GCA GCA CGC CGT TCT 

SASRSPSPPCPSAAARRS 
RPVDRPV LLAPAQQHAVL 
GQSIAQSSLPQRSSTPFL 

GHLRPLRGGGARRRPRHH 
VTYGRSDVEELAGVLD I I 
SRTVAPT SRRWRAS S T S S 

ACT GGC ACA TTG GCG CCC TCA GCT GGA GGA GGT CGC GCG GCT GCT CCA GCT ACT 
44019 44028 44037 44046 44055 44064 

TGA CCG TGT AAC CGC GGG AGT CGA CCT CCT CCA GCG CGC CGA CGA GGT CGA TGA 

*PCNRGSRPPPARRRGR* 
DRVTAGVDLLQRADEVDD 
TV*PRESTSSSAPTRSMM 

HPVLLRDVRRHPLAPLDG 
TRCSSAI SEGIHYRPFTE 
PAARPP SRSASTTAR S PR 



ACC ACG CCG 
44073 
TGG TGC GGC 



TGC TCC TCC 
44082 
ACG AGG AGG 



GCT AGC TGA 
44091 
CGA TCG ACT 



GCG GCT ACA 
441 00 
CGC CGA TGT 



CCA TCG CGC 
441 09 
GGT AGC GCG 



CCT TCC AGA 
441 1 8 
GGA AGG TCT 
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W C G T' R R*~ R S T R R' C G SAG R S 
GAARGGDRLADVVARE G L 
VRHEEAIDSPMW*RGKVS 

TGIAERVHRGQQALLGGH 
RELLKVSMGAKSLL SAAT 
GNWYS *PCAPRASCPprr 

GGG CAA GGT TAT CGA AGT GCC TGT ACG GCC GGA ACG ACT CGT TCC TCC GGC GGC 
44127 44136 44145 44154 44163 44172 

CCC GTT CCA ATA GCT TCA CGG ACA TGC CGG CCT TGC TGA GCA AGG AGG CCG CCG 

PVPIASRTCRPC*ARRPP 
PFQ*LHGHAGLAEQGGRR 
RSNS FTDMPALLSKEAAV 

I GGAWRRDRASKQVHLEG 
SGAPGGGIVLVKKSMSSG 
PDRRGVAS*SCKKPCPAG 

ACC TAG GGC GGC CGG GTG GCG GCT AGT GCT CGT GAA AAA ACC TGT ACC TCG AGG 
^ 44181 44190 44199 44208 44217 44226 

TGG ATC CCG CCG GCC CAC CGC CGA TCA CGA GCA CTT TTT TGG ACA TGG AGC TCC 

WIPPAHRRSRALFWTWSS 
GSRRPTADHEHFFGH GAP 
DPAGPPPITSTFLDMELP 



SII*TERRPA N R I S I F M R 
VSLEPKVDRR (m) A S L F S C G 
WQYNLN*TAACQPYFHVD 

GGT GAC TAT TAA GTC CAA AGT GCA GCG CCG CGT AAC GCC TAT CTT TAC TTG TAG 
44235 44244 44253 44262 44271 44280 

CCA CTG ATA ATT CAG GTT TCA CGT CGC GGC GCA TTG CGG ATA GAA ATG AAC ATC 

PLIIQVSRRGALRIEMNI 
H**FRFHVAAHCG*K*TS 
TDNSGFTSRRIADRNEHP 

CPYNH FVEGLTTAVS * H F 
ARTI TFYKESHLRSARTS 
PVPLQS I SRRTYDRRE LP 

GCC GTG CCC ATT AAC ACT TTA TGA AGA GGC TCA CAT CAG CGC TGC GAG ATC ACC 
44289 44298 44307 44316 44325 44334 

CGG CAC GGG TAA TTG TGA AAT ACT TCT CCG AGT GTA GTC GCG ACG CTC TAG TGG 

RHG*L*NTSPSVVATL*W 
GTGNCE ILLRV*SRRS SG 
ARVI VKYFSECSRDALVE 

R*DKKMRS*TADAEPNTG 
DRTRR* ARSHLMRKP I LA 
IELGEEHAVIYCGSRS *H 



TTA GAG ATC AGG AAG AAG TAC GCG CTG ATA CAT CGT AGG CGA AGC CCT AAT CAC 

- 173- 



44343 44352 ~ 44361 44370 44379 44388 

AAT CTC TAG TCC TTC TTC ATG CGC GAC TAT GTA GCA TCC GCT TCG GGA TTA GTG 



NL*SFFMRDYVASASGLV 
.ISSPSSCATM*HPLRD*C 
SLVLLHARLCSIRFGI SA 

LEAVTRYLLTIPVRTSVS 
SSRSRGTFSRSPFGRVSR 
RAGRGD QLPAHHS GAYQ G 

GGC TCG AGG CGC TGG CAG GAC ATT TCC TCG CAC TAC CCT TGG GCG CAT GAC TGG 
44397 44406 44415 44424 44433 44442 

CCG AGC TCC GCG ACC GTC CTG TAA AGG AGC GTG ATG GGA ACC CGC GTA CTG ACC 

PSSATVL *RSVMGTRVL T 
RAPRPSCKGA*WEPAY*P 
ELRDRPVKERDGNPRTDR 

ACKLAEDGVAEDVQRTRE 
PASSLKTESPKMWKGPAN 
LRVQSSRRRRS*GSAPHT 

CTC CGC GTG AAC TCT CGA AGC AGA GGC TGC CGA AGT AGG TGA ACG GCC CAC GCA 
44451 44460 44469 44478 44487 44496 

GAG GCG CAC TTG AGA GCT TCG TCT CCG ACG GCT TCA TCC ACT TGC CGG GTG CGT 

E AHL RA S S PTAS S T CRVR 
RRT * ELRLRRLHP LAGCV 
GALESFVSDGFIHLPGAF 

GRLEGFLRAGQQPPLQVH 
GASSAS SAHARSHRCS SM 
GRPARRLPTRGATAAVPC 

AGG GGC GCC TCG AGC GGC TTC TCC GCA CGC GGG ACG ACA CCG CCG TTG ACC TGT 
44505 44514 44523 44532 44541 44550 

TCC CCG CGG AGC TCG CCG AAG AGG CGT GCG CCC TGC TGT GGC GGC AAC TGG ACA 

SPRS SPKRRAPCCGGNWT 
PRGARRRGVRPAVA ATGH 
PAELAEEACALLWRQLDM 

VGVVRGGPRPFHDPQPHA 
SGSSGAVQVRSTTRSPTR 
PGRRGPWRSAPLPGAPPA 

ACC TGG GGC TGC TGG GCC GGT GGA CCT GCG CCC TTC ACC AGG CCG ACC CCC ACG 
44559 44568 44577 44586 44595 44604 

TGG ACC CCG ACG ACC CGG CCA CCT GGA CGC GGG AAG TGG TCC GGC TGG GGG TGC 

WTPTTRPPGRGKWSGWGC 
GPRRPGHLDAGSGPAGGA 
DPDDPATWTREVVRLGVR 

V V _V HEQAGGVGRRQVGGV 
SSSTNRRAALVGVSCAA* 
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CGC TGC TGC TGC ACA AGG ACG CGC GGC GGT TGT GGG GCT GCG ACG TGC GGC GGA 
44613 44622 44631 44640 44649 44658 

GCG ACG ACG ACG TGT TCC TGC GCG CCG CCA ACA CCC CGA CGC TGC ACG CCG CCT 

ATTTCSCAPPTPRRCTPP 
RRRRVPARRQHPDAARRL 
DDDVFLRAANTPTLHAAY 

VLEGPLAPPLGSVCTPVN 
SWSAPSPRHCGASAPRCT 
RGARRPPGTAARQRLDAR 

TGC TGG TCG AGC GGC CCC TCC CGG CCA CCG TCG GGC GAC TGC GTC CAG CCG TGC 
44667 44676 44685 44694 44703 44712 

ACG ACC AGC TCG CCG GGG AGG GCC GGT GGC AGC CCG CTG ACG CAG GTC GGC ACG 

TTSSPGRAGGSPLTQVGT 
RPARRGGPVAAR* RR SAR 

DQLAGEGRWQPADAGRHV 

GTRNGTVFRGSSVSS * P Q 
GPATERS SAARPSRP SR S 
ERHPKGHRLPGLL GLVVA 

AAG GGC CAC GCC AAA GGG CAC TGC TTC GCC GGG CTC CTC TGG CTC CTG ATG CCG 
44721 44730 44739 44748 44757 ' 44766 

TTC CCG GTG CGG TTT CCC GTG ACG AAG CGG CCC GAG GAG ACC GAG GAC TAC GGG 

F P (\T) RFPVTKRPEETEDYG X/f~ 
SRCGFP *RSGPRRPRTT A ^ ~ 
P G A SRDEAARGDRGLRL 

CMSALKRASSASASRSQD 
ACRRWSGPRPRPRRGPS T 
PVDVGAEQGLVRVGVPVP 



ACC GTG TAG CTG CGG TCG AAG GAC CGG CTC CTG CGC CTG CGG CTG GCC CTG ACC 
44775 44784 44793 44802 44811 44820 

TGG CAC ATC GAC GCC AGC TTC CTG GCC GAG GAC GCG GAC GCC GAC CGG GAC TGG 




AGG CCA CTC GAC CTG CAC TAG GGC GGC CTG ATG CTG TTC TAG AAG GCG ATG TTG 
44829 44838 44847 44856 44865 44874 

TCC GGT GAG CTG GAC GTG ATC CCG CCG GAC TAC GAC AAG ATC TTC CGC TAC AAC 



SGELDV I PPDYDK IFRYN 
P V W T * SRRTT TRSSATT 

R*AGRDPAGLRQDLPLQR 

- 175 - 



HDRPRASSSRSRNESVPS 
TTGRGPAAAGAGTRPCRR 
HPGAAPRQQEQEQERVGA 

CAC ACC AGG GCG CCG GCC CGC GAC GAC GAG GAC GAG GAC AAG AGC CTG TGG CCG 
44883 44892 44901 44910 44919 44928 

GTG TGG TCC CGC GGC CGG GCG CTG CTG CTC CTG CTC CTG TTC TCG GAC ACC GGC 

V W SRGR ALLLLLL F S D T G 
CGPAAGRCCSCSCSRTPA 
VVPRPGAAAPAPVLGHRR 

SSAGVSIRAPEWRSTGGS 
PPRAWASGRRSGGPRAAA 
LLVRGRQDAGAGVQVHRR 

CTC CTC CTG CGC GGG TGC GAC TAG GCG CGG CCG AGG GTG GAC CTG CAC GGC GGC 
44937 44946 44955 44964 44973 44982 

GAG GAG GAC GCG CCC ACG CTG ATC CGC GCC GGC TCC CAC CTG GAC GTG CCG CCG 

EEDAPTL IRA GSHL DVPP 
RRTRPR* SAPAPTWTCRR 
GGRAHADPRRLPPGRAAA 

SSGYPASPV*RSAPSTPR 
APATHRPPCRGPPRPPpv 
QQLRIARLAGVQLGPLHS 

GAC GAC CTC GGC ATA CCG CGC CTC CCG TGG ATG GAC CTC CGG CCC CTC CAC CCT 
44991 45000 45009 45018 45027 45036 

CTG CTG GAG CCG TAT GGC GCG GAG GGC ACC TAC CTG GAG GCC GGG GAG GTG GGA 

LLEPYGAEGTYLEAGEVG 
CWSRMARRAPTWRP GRWD 
AGAVWRGGHLPGGRGGGT 

SRGSLDAVPFAPSA*RHW 
P G A A * TPWPSPRPRR.DTG 
PVPREPRGRPLGPVGIQA 

GCC CTG GCC GGC GAG TCC AGC CGG TGC CCC TTC CGG CCC CTG CGG ATA GAC ACG 
45045 45054 45063 45072 45081 45090 

CGG GAC CGG CCG CTC AGG TCG GCC ACG GGG AAG GCC GGG GAC GCC TAT CTG TGC 




GTG GGG AAG GAC CAC GTG TGC GGC CAC 
45099 45108 45117 

CAC CCC TTC CTG GTG CAC ACG CCG GTG 



CGG TTG TGG CCG TGG GCG GGC GCG AAG 
45126 45135 45144 

GCC AAC ACC GGC ACC CGC CCG CGC TTC 
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TPSWCTRRWPTPAPARAS 
PLPGAHAGGQHRHP PALH 



AWGFRSGTPCSSSS RGSP 
PGASGAARPAARVRGARR 
HGLRVQQGHPLE FEVPGV 

TAC CGG GTC GGC TTG GAC GAC GGG CAC CCC GTC GAG CTT GAG CTG GCC GGG CTG 
45153 45162 45171 45180 45189 45198 

ATG GCC CAG CCG AAC CTG CTG CCC GTG GGG CAG CTC GAA CTC GAC CGG CCC GAC 

MAQPNLLPVGQLELDRPD 
WPSRTCCPWGSSNSTGPT 
GPAEPAARGAARTRPARR 

RYVGTSCATRRPRP LSMG 
ATCGPRAPLAGPGPCPCV 
PPVGRDLLCHAPAQALVY 

CCC GCC ATG TGG GGC CAG CTC GTC CGT CAC GCG GCC CCG GAC CCG TTC CTG TAT 
45207 45216 45225 45234 45243 45252 

GGG CGG TAC ACC CCG GTC GAG CAG GCA GTG CGC CGG GGC CTG GGC AAG GAC ATA 

GRYTPVEQAVRRGL GKD I 
GGTPR S SRQCAGAWARTY 
AVHP GRAGSAPGPGQGHT 

RRS P R HRSPPSAPR p AGR 
AVLPGTVLHRLLLGHRGG 
RSSLAPSSIASFCATAGG 

GGC GCT GCT CTC CCG GCC ACT GCT CTA CCG CCT CTT CGT CCG GCA CCG CGG GGG 
45261 45270 45279 45288 45297 45306 

CCG CGA CGA GAG GGC CGG TGA CGA GAT GGC GGA GAA GCA GGC CGT GGC GCC CCC 

PRREGR *RDGGEAGRGAP 
RDERAGDEMAEKQAVAPP 
ATRGPVTRWRRSRPWRPP 

SPGS GAPTRRFPWGPRPG 
PRVQDPQHEASHGGLDHA 
QVSRIRSTNPPIAVWTTP 

GAC CTG CCT GGA CTA GGC CGA CCA CAA GCC GCC TTA CCG GTG GGT CCA GCA CCC 
45315 45324 45333 45342 45351 45360 

CTG GAC GGA CCT GAT CCG GCT GGT GTT CGG CGG AAT GGC CAC CCA GGT CGT GGG 

LDGPD PAGVRR N_ G H P G R G ^ 
WTDL I RLVFGG (m) A T Q V V G CJ 
GRT* SGWCSAEWPPRSWA 

^> 

PPAAAAARRSRPPRVSRR 
QRHPQPQGVRDPLAFPGG 
RATRSRSGSAIPSPSRVA 

GGA CCG CCA CGC CGA CGC CGA CGG GCT GCG CTA GCC CCT CCC GCT TGC CTG GCG 

- 177- 



45369" 45375 45387"" 45396" 45405 * 45414 

CCT GGC GGT GCG GCT GCG GCT GCC CGA CGC GAT CGG GGA GGG CGA ACG GAC CGC 



PGGAAAAARRDRGGRTDR 
LAVRLRLPDAIGEGERTA 
WRCGCGCPTRSGRANGPP 

RAPRRSRSRVRQWSGATA 
VPQGGVELAFGSGHVPQQ 

SPSAASKSLSGAAMFRSN 

GCT GCC CGA CCG GCG GCT GAA GCT CTC GCT TGG GCG ACG GTA CTT GGC CGA CAA 
45423 45432 45441 45450 45459 45468 

CGA CGG GCT GGC CGC CGA CTT CGA GAG CGA ACC CGC TGC CAT GAA CCG GCT GTT 

RRAGRRLRERTRCHE PAV 
DGLAADFE SEPAAMNRL L 
TGWPPTSRANPLP*TGCC 

RGPRARLAARTWARRTRG 
AAQGRESHQALGLGAHEG 
RPRAASPTSRSDLGP TNA 

CGC GCC GGA CCG GCG CGA GCC TCA CGA CGC GCT CAG GTT CGG GCC GCA CAA GCG 
45477 45486 45495 45504 45513 45522 

GCG CGG CCT GGC CGC GCT CGG AGT GCT GCG CGA GTC CAA GCC CGG CGT GTT CGC 

ARPGRARSAARVQARRVR 
RGLAALGVLRESKPGVFA 
AAWPRSECCASPSPACSP 

SVPR PVADRRGSATRGSV 
QCRDPFQTAGVARRGEV* 
RVGTP SSRRASREGDKWE 

GGA CTG TGG CCA GCC CCT TGA CGC AGC GCG GCT GGC GAG CGG CAG GAA GGT GAG 
45531 45540 45549 45558 45567 45576 

CCT GAC ACC GGT CGG GGA ACT GCG TCG CGC CGA CCG CTC GCC GTC CTT CCA CTC 

PDT GRGTASRRPL AV L P L 
LTPVGELRRADRSPS FHS 
*HRS GNCVAPTARRP STH 

PGSA*RDRPRSPRAAGPG 
QGPHEGIGRDRRGPLVQV 
SARI SVSGATAVAQCCRS 

TGA CCG GGC CTA CGA GTG GCT AGG GCG CCA GCG CTG CCG GAC CGT CGT GGA CCT 
45585 45594 45603 45612 45621 45630 

ACT GGC CCG GAT GCT CAC CGA TCC CGC GGT CGC GAC GGC CTG GCA GCA CCT GGA 

TGPDAHRSRGRDGLAAPG 
LARMLTDPAVATAWQHLD 
WPGCSPIPRSRRPGSTWT 

C R * V „G CRRGPRRGRRRGPSR 
VADAGAARGEVVDEAPVE 
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GGT GTC GCA GGC GTG GCC GCC GGG CCG GAA GCT GGT GCA GAA GCC GGC CCT GAA 
45639 45648 45657 45666 45675 45684 

CCA CAG CGT CCG CAC CGG CGG CCC GGC CTT CGA CCA CGT CTT CGG CCG GGA CTT 

PQRPHRRPGLRPRLRPQL 
HSVRTGGPAFDHVFGRDF 
TASAPAARPSTTSSAGTS 

RTG P PRGRGTTARCR P S S 

ERVQRVVGVQRPEVVRRH 
KAYRAS SGSRDHS * LAA I 

GAA GCG CAT GGA CCG CCT GCT GGG GCT GGA CAG CAC CGA GAT GTT GCG CCG CTA 
45693 45702 45711 45720 45729 45738 

CTT CGC GTA CCT GGC GGA CGA CCC CGA CCT GTC GTG GCT CTA CAA CGC GGC GAT 

LRVPGGRPRPVVALQRQD 
FAYLADDPDLSWLYNAAM 
SRTWRTTPTCRGSTTRR* 

GPCRHSRRGPRPAGP SRR 
ALAGTPDGAQDRRVLVE G 
LWPVPPIAPRTAACWSKE 

CTC GGT CCC GTG GCC ACC CTA GCG GCC GGA CCA GCG CCG CGT GGT CCT GAA GAG 
45747 45756 45765 45774 45783 45792 

GAG CCA GGG CAC CGG TGG GAT CGC CGG CCT GGT CGC GGC GCA CCA GGA CTT CTC 

EPGHRWDRRPGRGAPGLL 
SQGTGGIAGLVAAHQDF S 
ARAPVGSPAWSRRTRT SP 

RGCRPPRRPRPRSA APRP 
ADAGHHVDPAPVPRQQGR 
PTRVTTSTPPPSPVS SAA 

GCC GCA GGC GTG GCA CCA CCT GCA GCC CCC GCC CCT GCC CTG CGA CGA CCG GCG 
45801 45810 45819 45828 45837 45846 

CGG CGT CCG CAC CGT GGT GGA CGT CGG GGG CGG GGA CGG GAC GCT GCT GGC CGC 

RRPHRGGRRGRGRDAAGR 
GVRTVVDV-GGGDGTLLAA 
ASAPWWTSGAGTGRCWPR 

AARAGRAARRATRSPPRp 
HQARVG RQAAHQVVRRGP 
TSRACGESRPTSYSEAAP 

CCA CGA CGC GCG CGT GGG GAG CGA CGC GCC GCA CGA CAT GCT GAG CCG CCG GCC 
45855 45864 45873 45882 45891 45900 

GGT GCT GCG CGC GCA CCC CTC GCT GCG CGG CGT GCT GTA CGA CTC GGC GGC CGG 

GAARAPLAARRAVRLGGR 
VL.JJAHPSLRGVLYDSAAG 
CCARTPRCAACCTTRRPG 
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RAPRPPAPPPPRRPGRPP 
DRLGPLHQRRRADRVARH 
TACAPSTSAAAPTASRAT 

CCA GCG CGT CCG GCC CCT CCA CGA CCG CCG CCG CCC GCA GCG CCT GGC GCG CCA 
45909 45918 45927 45936 45945 45954 

GGT CGC GCA GGC CGG GGA GGT GCT GGC GGC GGC GGG CGT CGC GGA CCG CGC GGT 

GRAGRGGAGGGGRRGPRG 
VAQAGEVLAAAGVAD RAV 
SRRPGRCWRRRASR T ARW 

PRRSRRRRVRPRHGRGA* 
LGAVEEGGYGLATVEVQE 
SAPSKKAATGSPPSR*RS 

CCT CCG GCC GCT GAA GAA GCG GCG GCA TGG GCT CCC GCC ACT GGA GAT GGA CGA 
45963 45972 45981 45990 45999 46008 

GGA GGC CGG CGA CTT CTT CGC CGC CGT ACC CGA GGG CGG TGA CCT CTA CCT GCT 

GGRRLLRRRTRGR*PLPA 
EAGDF FAAVPEGGDLYLL 
RPAT S S PPYPRAVT S T C S 

SRRG HSPPRAPRSSEPAS 
LADDMAPLVLPGRPNQRV 
LLTTW PQSSSRAALIRAC 

GTT CTC GCA GCA GGT ACC GAC CCT CCT GCT CGC CCG GCG CTC CTA AGA CCG CGT 
46017 46026 46035 46044 46053 46062 

CAA GAG CGT CGT CCA TGG CTG GGA GGA CGA GCG GGC CGC GAG GAT TCT GGC GCA 

QERRPWL GGRAGRED S GA 
KSVVHGWEDERAARI LAH 
RASSMAGRTSGPRGFW R T 

GGPVAPARGSR* PRAGAA 
AAPCQRRVAPDDHDLVQQ 
QRRASGACPRI TMTS CRS 

GAC GGC GGC CCG TGA CGG CCG CGT GCC GGC CTA GCA GTA CCA GCT CGT GGA CGA 
46071 46080 46089 46098 46107 46116 

CTG CCG CCG GGC ACT GCC GGC GCA CGG CCG GAT CGT CAT GGT CGA GCA CCT GCT 

LPPGTAGARPDRHGRAPA 
CRRALPAHGRIVMVEHLL 
AAGHCRRTAGS SWS S TCC 

RCPARPRRASSRG*RG*G 
GVRH GRVGHRRGVEVVE V 
GSVTGASATG*VV*RLSRL 

CGG GCT GTG CCA CGG GCG CCT GCG GCA CGG CTG CTG GAT GGA GTT GCT GGA GTT 
46125 46134 46143 46152 46161 46170 

GCC CGA CAC GGT GCC CGC GGA CGC CGT GCC GAC GAC CTA CCT CAA CGA CCT CAA 
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PDTVPADAVPTTYLNDLN 
PTRCPRTPCRRPTSTTS 

AP*RCRAPACAHRSRVA 
QQDVAVPQLARTAVEFLE 
RSTLPL PSSRVRPSKSCS 

GGA CGA CCA GTT GCC GTT GCC CGA CCT CGC GTG CGC ACC GCT GAA GCT TGT CGA 
46179 46188 46197 46206 46215 46224 

CCT GCT GGT CAA CGG CAA CGG GCT GGA GCG CAC GCG TGG CGA CTT CGA ACA GCT 

PAGQRQRAGAHAWRLRTA 
LLVNGN'GLERTRGDF E Q L 
CWSTATGWSARVAT SNS 

RPPPGSPRLP*AAPRFRi 
ARRRAQRDFRDRRQGS GV 
QAAAPRVTSATVGSAPVS 

GAC GCG CCG CCG CCC GGA CTG CCA GCT TCG CCA GTG CGG CGA CCG GCC TTG GCT 
46233 46242 46251 46260 46269 46278 

CTG CGC GGC GGC GGG CCT GAC GGT CGA AGC GGT CAC GCC GCT GGC CGG AAC CGA 

LRGGGPDGRSGHAAGRNR 
CAAAGLTVEAVTPLAGTD 
ARRRA*RSKRSRRWPEPT 

TASRPRARKPQGAR S LP G 
QPQ DLGHGSRSVREASRG 
RHSI SATGAEASGSPQAA 

GGA CAC CGA CTA GCT CCG GCA CGG GCG AAG CCG ACT GGG CGA GCC GAC TCG CCG 
46287 46296 46305 46314 46323 46332 

CCT GTG GCT GAT CGA GGC CGT GCC CGC TTC GGC TGA CCC GCT CGG CTG AGC GGC 

PVADRGRARFG*PARLSG 
L WLI EAVPASADPLG*AA 
CG*SRPCPLRLTRSAERP 

EPFKVT SPLRMAPDPRI T 
KRSN*RARSG*QPIPGFP 
RGPI EGHEPAENRSRASH 

GGA AGG CCC TTA AAG TGG CAC GAG CCC TCG GAG TAA CGC CCT AGC CCG GCT TAC 
46341 46350 46359 46368 46377 46386 

CCT TCC GGG AAT TTC ACC GTG CTC GGG AGC CTC ATT GCG GGA TCG GGC CGA ATG 

PSGNFTVLGSLIAGSGRM 
LPGI SPCSGASLRDRAEW 
FREFHRAREPHCGI GPNG 

TGDLLPR*HI**VAQAFL 
RGMWCPVSTFESYQKRSC 
DDWGALSALSNVI SSARV 



CAG CAG GGT AGG TCG TTC CCT GCG ATC ACT TAA GTG ATA TGA CGA ACG CGC TTG 
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46395 464*04* 46413' 46 r 422~ 46431 46440 

GTC GTC CCA TCC AGC AAG GGA CGC TAG TGA ATT CAC TAT ACT GCT TGC GCG AAC 



VVPSSKGR**IHYTACAN 
. S SHPARDASEFT I L LAR T 

RPIQQGTLVNSLYCLREQ 

SKGPSKGYRKRHSAIRMI 
HNVQARGTGNGTVP SVC * 

TI *RPEERVTEPSQRYAN 

TCA CTA AAT GGA CCC GAG AAG GGC ATG GCA AAG GCC ACT GAC CGC TAT GCG TAA 
46449 46458 46467 46476 46485 46494 

AGT GAT TTA CCT GGG CTC TTC CCG TAC CGT TTC CGG TGA CTG GCG ATA CGC ATT 

SDLPGLFPYRFR*LAIRI 
VIYLGSSRTVSGDWRYAL 
*FTWALPVPFPVTGDTHY 

*PQSI IRDLRA SMVPIVP 
ERSPSSET*ALA**PF*Q 
NVAPLHNQRPSRENRSDS 

TAA GTG CCG ACC CTC TAC TAA GAC AGA TCC GCT CGC GAG TAA TGC CCT TAG TGA 
46503 46512 46521 46530 46539 46548 

ATT CAC GGC TGG GAG ATG ATT CTG TCT AGG CGA GCG CTC ATT ACG GGA ATC ACT 

I H G W E (m} ILSRRALITGIT 
FTAGR* FCLGERSLRE S L 
SRLGDDSV*ASAHYGNHW 



WSPV*RAR*SMSDPYSTK 
GPHCKGRADV*RIRIHLR 
ALIASVERTLEDFGS I FD 

CCG GTC CTA CCG TGA ATG GAG CGC GCA GTT GAG TAG CTT AGG CCT ATA CTT CAG 
46557 46566 46575 46584 46593 46602 

GGC CAG GAT GGC ACT TAC CTC GCG CGT CAA CTC ATC GAA TCC GGA TAT GAA GTC 

GQDGTYLA RQLIESGYEV 
ARMALT SRVNSSNPDMK S 
PGWHLPRASTHRIRI * S L 

PI TRPCPRGYARSPR GRC 
R F PARA PGA THGRRD AGA 
ESHHAPLAPRIGAVTPGQ 

AAG CCT TAC CAC GCG CCC GTC CCG GCC GGC ATA CGG GCG CTG CCA GCC GGG GAC 
46611 46620 46629 46638 46647 46656 

TTC GGA ATG GTG CGC GGG CAG GGC CGG CCG TAT GCC CGC GAC GGT CGG CCC CTG 

FGMVRGQGRPYARDGRP L 
SEWCAGRAGRMPATVGP C 
RNGARAGPAVCPRRSAPA 

G S fcw M R T T L P S K S S W V L R I A 
GPCGLPSRRSAPGSSGSR 
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GTG GGC CTG TAG GCT CAC CAC TCG CCG CTG AAC GAG CTG GTC TGC TCG GAC TAG 
46665 46674 46683 46692 46701 46710 

CAC CCG GAC ATC CGA GTG GTG AGC GGC GAC TTG CTG GAC CAG ACG AGC CTG ATC 

HPDIRVVSGDLLDQTSLI 
TRTSEW*AATCWTRRA*S 
PGHPSGERRLAGPDEPDR 

ATSCDQGVSI*LRPARDN 
QQRATRGWRSRCGRRGTT 
SSDLLGAGGLDVVEAGQR 

CGA CGA CAG CTC GTC AGG ACG GGG TGG CTC TAG ATG TTG GAG CCG CGG GAC AGC 
46719 46728 46737 46746 46755 46764 

GCT GCT GTC GAG CAG TCC TGC CCC ACC GAG ATC TAC AAC CTC GGC GCC CTG TCG 

AAVEQSCPTEIYNLGALS 
LLSSSPAPPRSTTSAPCR 
CCRAVLPHRDLQPRRPVV 

TGTEQFCGVTAASTVPLP 
RGPRRSAAWRQRPP SRCP 
EDR D GP L L GGNGR L H GA L 

AAG CAG GGC CAG AGG ACC TTC GTC GGG TGG CAA CGG CGC CTC CAC TGG CCG TTC 
46773 46782 46791 46800 46809 46818 

TTC GTC CCG GTC TCC TGG AAG CAG CCC ACC GTT GCC GCG GAG GTG ACC GGC AAG 

FVPVSWKQPTVAAEVTGK 
SSRSPGSSPPLPRR*PAR 
RPGL LEAAHRCRGGDRQG 

TSRI SSAMRMVAPSLLER 
HAASAPPWGC*PPA*CNG 
THQPHQLGDADRRP EAT G 

CCA CAC GAC GCC TAC GAC CTC CGG TAG GCG TAG TGC CGC CCC GAG TCG TCA AGG 
46827 46836 46845 46854 46863 46872 

GGT GTG CTG CGG ATG CTG GAG GCC ATC CGC ATC ACG GCG GGG CTC AGC AGT TCC 

GVLRMLEAIRITAGLSSS 
VCCGCWRPSASRRGSAVP 
CAADAGGHPHHGGAQQFP 

VVLLPTGRK**AEVE S IN 
SWWCRRGASRDPRWRPST 
PGGAAADRAEILGGGRLH 

GCC TGG TGG TCG TCG CCG CAG GGC GCG AAG ATA GTC CGG AGG TGG AGC CTC TAC 
46881 46890 46899 46908 46917 46926 

CGG ACC ACC AGC AGC GGC GTC CCG CGC TTC TAT CAG GCC TCC ACC TCG GAG ATG 

RTTSSGVPRFYQASTSEM 
GPXAAASRASIRPPPRRC 
DHQQRRPALLSGLHLGDV 
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PFTRSDGCLSAVGKWGR 
RFPAPTGASRPWARGGAC 
ESLHPLGRLALGRGEVRA 

AAG CCT TTC CAC GCC CTC AGG GGC GTC TCG CTC CGG TGC GGG AAG GTG GGC GCG 
46935 46944 46953 46962 46971 46980 

TTC GGA AAG GTG CGG GAG TCC CCG CAG AGC GAG GCC ACG CCC TTC CAC CCG CGC 

FGKVRE SPQSEATPFHPR 
SERCGSPRRARPRPSTRA 
RKGAGVPAERGHALPPAQ 

G*PTALANPC*MTCF*RS 
GRRPPWPTRASCPASSGR 
AGVPHGLREPVVHHLVVA 

TCG GGG ATG CCC CAC CGG TTC CGC AAG CCC GTG ATG TAC CAC GTC TTG ATG GCG 
46989 46998 47007 47016 47025 47034 

AGC CCC TAC GGG GTG GCC AAG GCG TTC GGG CAC TAC ATG GTG CAG AAC TAC CGC 

SPYGVAKAFGHYMVQNYR 
APTGWPRRSGTTWCRTTA 
PLRGGQGVRALHGAELPR 

DYPINATLPIRNLWSDGI 
TTRSTRP*RSGT*GRTVS 
LRVPHERDAPDQEVVL *R 

CTC AGC ATG CCC TAC AAG CGC CAG TCG CCC TAG GAC AAG TTG GTG CTC AGT GGC 
47043 47052 47061 47070 47079 47088 

GAG TCG TAC GGG ATG TTC GCG GTC AGC GGG ATC CTG TTC AAC CAC GAG TCA CCG 

ESYGMFAVSGILFNHE SP 
SRTGCSRSAGSCSTT SHR 
VVRDVRGQRDPVQPRVTD 

RPGSNTVRLTDSPTAATF 
GPGPTR*ACP- TARPPRRS 
DPARLEDRALHREPHGGH 

TAG GCC CCG GGC CTC AAG CAG TGC GCG TTC CAC AGC GAG CCC CAC CGG CGG CAC 
47097 47106 47115 47124 47133 47142 

ATC CGG GGC CCG GAG TTC GTC ACG CGC AAG GTG TCG CTC GGG GTG GCC GCC GTG 

IRGPEFVTRKVSLGVAAV 
SGARSSSRARCRSGWPP * 
PGPGVRHAQGVARGGRRE 

SPRI SLSRSPLRSASRSQ 
APGSPCAGAPCGPPPVRS 
LQAQHVLEPQAVQLRFAV 



TTC GAC CCG GAC TAC CTG TTC GAG GCC 
47151 47160 47169 

AAG CTG GGC CTG ATG GAC AAG CTC CGG 



GAC CCG TTG GAC CTC CGC CTT GCG CTG 
47178 47187 47196 

CTG GGC AAC CTG GAG GCG GAA CGC GAC 
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, P K A P S * T R P M V I I SA WS i 
P S R L P S RARC S S S AR G P R 
PAECPVVHAAHRHHEGLV 

ACC CCG AAG CGT CCC CTG ATG CAC GCG CCG TAG TGC TAC TAC GAG CGG GTC CTG 
47205 47214 47223 47232 47241 47250 

TGG GGC TTC GCA GGG GAC TAC GTG CGC GGC ATG ACG ATG ATG CTC GCC CAG GAC 

WGFAGDYVR. GMTMMLAQ D 
GAS QGTTCAA*R*CSPRT 
GLRRGLRARHDDDARPGI 

GSSRTRPVPIVWRTRSR^ 
APPGRGRCRS*GGPARDP 
LRLVEDEAGPDGVPHAI Q 

CTC GGC CTC CTG GAG CAG GAG CCG TGG CCC TAG TGG GTG GCC CAC GCG CTA GAC 
47259 47268 47277 47286 47295 47304 

GAG CCG GAG GAC CTC GTC CTC GGC ACC GGG ATC ACC CAC CGG GTG CGC GAT CTG 

EPEDLVLGTGITHRVRDL 
SRR T S S SAPGS P T G C A I W 
AGGPRPRHRDHPPGARS C 

SKAKAC TPSSQRSWT ST i 
PNRRRARRAPSARGRPPP 
HIEGERVDPQVPAVVHLH 

CAC CTA AAG CGG AAG CGC GTG CAG CCC GAC CTG ACC GCG CTG GTG CAC CTC CAC 
47313 47322 47331 47340 47349 47358 

GTG GAT TTC GCC TTC GCG CAC GTC GGG CTG GAC TGG CGC GAC CAC GTG GAG GTG 

VDFAFAHVGLDWRDHVEV 
W I SPSRTSGWTGATTWRW 
GFRLRARRAGLARPR GG ( 

ERSSRGASTSSSQASRLI 
SGAAAGPPPPVARRRGS G 
VGPQQARRLHFQEAGVQA 

CTG AGG GCC GAC GAC GCG GGC CGC CTC CAC CTT GAC GAG ACG CGG CTG GAC TCG 
47367 47376 47385 47394 47403 47412 

GAC TCC CGG CTG CTG CGC CCG GCG GAG GTG GAA CTG CTC TGC GCC GAC CTG AGC 

D SRLLRPAEVELLCADL S 
TPGCCARRRWNCSAPT * A 
LPAAAPGGG GTALRRPE I 

ARCFSPQFGSTENSS S T I 
REASAR SSARPRTRPVPR 
ASPLLEAPLGLDRELFQD 

GCG CGA GCC GTC TTC GAG CCG ACC TTC GGG CTC CAG AGC AAG CTC CTT GAC CAG 
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47421 47430 47439" 47448 47457 ' 47466 

CGC GCT CGG CAG AAG CTC GGC TGG AAG CCC GAG GTC TCG TTC GAG GAA CTG GTC 



RARQKLGWKPEVSFEELV 
ALGRSSAGSPRSRSRNWS 
RSAEARLEARGLVRGTGR 

MITSLSRRRSVSLSSAAP 
WSPRCRGAGA*RCHPRRR 

GHHDVAVQAQEGVTLVGG 

CGG TAC TAC CAG CTG TCG CTG GAC GCG GAC GAG TGG CTG TCA CTC CTG CGG CGG 
47475 47484 47493 47502 47511 47520 

GCC ATG ATG GTC GAC AGC GAC CTG CGC CTG CTC ACC GAC AGT GAG GAC GCC GCC 

AMMVDSDLRLLTDSEDAA 
P*WSTATCACSPTVRTPP 
HDGRQRPAPAHRQ*GRRR 

SATRSCAPRHHAERCALD 
RPRER .V PRDTTLRGAPWT 
A L GNE F L GTQPS G GP L G P 

CCG CTC CGG CAA GAG CTT GTC CGG CCA GAC ACC ACT CGG AGG GCC GTC CGG TCC 
47529 47538 47547 47556 47565 47574 

GGC GAG GCC GTT CTC GAA CAG GCC GGT CTG TGG TGA GCC TCC CGG CAG GCC AGG 

GEAVLEQAGLW*ASRQAR 
ARPFSNRPVC G E P P G R P G 
RGRSRTGRSv(v)sLPAGQV 

— ~> 

AAECSC SGEGRLRVQRVD 
PPRARARARGESAYRDST 
RRGRVLVLGGRPP TGTPR 

AGC CGC CGG AGC GTG CTC GTG CTC GGG AGG GGA GCC TCC GCA TGG ACA GCC TGC 
47583 47592 47601 47610 47619 47628 

TCG GCG GCC TCG CAC GAG CAC GAG CCC TCC CCT CGG AGG CGT ACC TGT CGG ACG 

S A A S H E HEPSPRRRTCRT 
RRPRTSTSPPLGGVPVGR 
GGLARARAL'PSEAYL SDV 

GTRLEDVPEGPAGGGRLA 
APASNMSQNARHEAAACH 
RRHPT*RSTRGTSRRRAT 

AGC GGC CAC GCC TCA AGT AGC TGA CCA AGC GGG CCA CGA GGC GGC GGC GCG TCA 
47637 47646 47655 47664 47673 47682 

TCG CCG GTG CGG AGT TCA TCG ACT GGT TCG CCC GGT GCT CCG CCG CCG CGC AGT 

SPVRSS STGSPGAPPPRS 
RRCGVHRLVRPVLRRRAV 
AGAEFI DWFARCSAAAQC 

P H , R PRRQGLQPSPPEVGV 
RT VRAG SVSSRRHRNSAS 
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CGG CCC ACT GCG CCC GCG GCG ACT GGC TCG ACG CCG CTA CCG CCA AGC TGC GGC 
47691 47700 47709 47718 47727 47736 

GCC GGG TGA CGC GGG CGC CGC TGA CCG AGC TGC GGC GAT GGC GGT TCG ACG CCG 

AG*RGRR*PSCGDGGSTP 
PGDAGAADRAAAMAVRRR 

RVTR APLTELRRWRFDAD 

RSVERVLGSGEEGDLAQP 
VPFRAC SDPAKKAT S P .R R 
CPFGRARTRLRRRRRPGA 

TGT GCC CTT TGG AGC GCG TGC TCA GGC CTC GGA AGA AGC GGC AGC TCC CGG ACG 
47745 47754 47763 47772 47781 47790 

ACA CGG GAA ACC TCG CGC ACG AGT CCG GAG CCT TCT TCG CCG TCG AGG GCC TGC 

TRETSRTSPEPSSPSRAC 
HGKPRARVRSLLRRRGPA 
TGNLAHESGAFFAVEGLR 

HAGTVPRDGLPALGDDVL 
TRVL *PGTGSHLWGMMLW 
PACWNRAPGRTSGAW**G 

CCC ACG CGT GGT CAA TGC CCG GCC AGG GGC TCA CCT CGG TCG GGT AGT AGT TGG 
47799 47808 47817 47826 47835 47844 

GGG TGC GCA CCA GTT ACG GGC CGG TCC CCG AGT GGA GCC AGC CCA TCA TCA ACC 

GCAPVTGRSPSGASPSST 
GAHQLRAGPRVEPAHHQP 
VRTSYGPVPEWSQPI INQ 

RLDADEAHQDLLDVANRV 
GSIPMRPMSTLSTSPTGC 
APSRCGRCAP*PPRRREA 

TCG GCC TCT AGC CGT AGG AGC CGT ACG ACC AGT TCC TCC AGC TGC CGC AAG GCG 
47853 47862 47871 47880 47889 47898 

AGC CGG AGA TCG GCA TCC TCG GCA TGC TGG TCA AGG AGG TCG ACG GCG TTC CGC 

SRRSAS SACWSRRSTAFR 
AGDRHPRHAGQGGRRRS A 
PE IG I LGMLVKEVDGVPH 

AEHL GLDLGAVVVADLQR 
QRTCAL I SG PLWLRMWSD 
SGRAPWSRARCGCGCGAT 

TGA CGG AGC ACG TCC GGT TCT AGC TCG GGC CGT TGG TGT TGG CGT AGG TCG ACA 
47907 47916 47925 47934 47943 47952 

ACT GCC TCG TGC AGG CCA AGA TCG AGC CCG GCA ACC ACA ACC GCA TCC AGC TGT 

TASCRPRSSPATTTASSC 
LP RAGQDRARQPQPHPAV 
CL^VqAK I EPGNHNR I QL S 
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RGDLGGAAVVGADVLAAA 
GVTWAVRLL*VRMWWPRL 
ASRGPWGCCSCGCGGPGC 

GCG GCT GGC AGG TCC GGT GGG CGT CGT TGA TGT GGG CGT AGG TGG TCC CGG CGT 
47961 47970 47979 47988 47997 48006 

CGC CGA CCG TCC AGG CCA CCC GCA GCA ACT ACA CCC GCA TCC ACC AGG GCC GCA 

RRPSRPPAATTPASTRAA 
ADRPGHPQQLHPHPPGPQ 
PTVQATRSNYTRIHQGRS 

GTIQLEEGLGARAAGQHV 
VR*RSNKVLAPAPRVRTS 
CGNDPTR*WPRRPGCGPP 

CGT GGG CAA TAG ACC TCA AGA AGT GGT TCC GGC CGC GCC CGG CGT GGG ACC ACC 
48015 48024 48033 48042 48051 48060 

GCA CCC GTT ATC TGG AGT TCT TCA CCA AGG CCG GCG CGG GCC GCA CCC TGG TGG 

APVIWSSSPRPARAAPWW 
HPLSGVLHQGRRGPHPGG 
TRYLEFFTKAGAGRTLVD 

DQLGLLARPKQALAVAVH 
TRCD SCPAHNRRLRLRLM 
RGATRAPRTTEACAC GCC 

TGC AGG ACG TCA GGC TCG TCC CGC GCA CCA AAG ACG CGT TCG CGT TGG CGT TGT 
48069 48078 48087 48096 48105 48114 

ACG TCC TGC AGT CCG AGC AGG GCG CGT GGT TTC TGC GCA AGC GCA ACC GCA ACA 

TSCSPSRARGFCASATAT 
RPAVRAGRVVSAQAQPQH 
VLQSEQGAWFLRKRNRNM 

DDLHSLVHGGGLAVVPQR 
TTWTASSTGAALP*WQSG 
PRGPPQPRARRWP SGSAA 

ACC AGC AGG TCC ACC GAC TCC TGC ACG GGC GGC GGT TCC CGA TGG TGA CCG ACG 
48123 48132 48141 48150 48159 48168 

TGG TCG TCC AGG TGG CTG AGG ACG TGC CCG CCG CCA AGG GCT ACC ACT GGC TGC 

WSSRWLRTCPPPRATTGC 
GRPGG* GRARRQGL P L A A 

VVQVAEDVPAAKGY. HWLP 

QGFQPPQQADVAQDVHVG 
SVSSRRSSRMSPRTLMSV 
ASRVAAAAACRRGP*CPC 

GCG ACT GGC TTG ACG CCG CCG ACG ACG CGT AGC TGC CGG ACC AGT TGT ACC TGT 
48177 48186 48195 48204 48213 48222 

CGC TGA CCG AAC TGC GGC GGC TGC TGC GCA TCG ACG GCC TGG TCA ACA TGG ACA 
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ADRTAAAAAHRRPQQHGH 
LTELRRLLRIDGLVNMDT 

.PGHQGAERRIREGGGPRH 
RVTSAQRGASVNGAERGT 
6SRAPR66PPYT6RRGAP 

GGG CCT GGC ACG ACC GGA CGG AGG GCC GCC TAT GCA AGG GGC GGA GGG CCG GCC 
48231 48240 48249 48258 48267 48276 

CCC GGA CCG TGC TGG CCT GCC TCC CGG CGG ATA CGT TCC CCG CCT CCC GGC CGG 

PGPCWPASRRIRSPPPGR 
PDRAGLPPGGYVPRLPAG 
RTVLACLPADTFPAS RPV 

RDTVDPRCEHQRRRALAG 
GTPSTPAASTSDDVPWPV 
APRHRRPPVRATT SP GPC 

ACG GCC AGC CAC TGC AGC CCC GCC GTG AGC ACG ACA GCA GCT GCC CGG TCC CGT 
48285 48294 48303 48312 48321 48330 

TGC CGG TCG GTG ACG TCG GGG CGG CAC TCG TGC TGT CGT CGA CGG GCC AGG GCA 

CRSVT S GRHSCCRRRARA 
A G R * RRGGTRAVVDGP GH 
PVGDVGAALVLS STGQGT 

GQVVHPGHQAPEGLGLAP 
ERFSMPATSRQNVSALLR 
RGSRCPPRAAST*RPWSG 

GGA GGG ACT TGC TGT ACC CCC GGC ACG ACG CGA CCA AGT GGC TCC GGT TCT CGG 
48339 48348 48357 48366 48375 48384 

CCT CCC TGA ACG ACA TGG GGG CCG TGC TGC GCT GGT TCA CCG AGG CCA AGA GCC 

PP*TTWGPCCAGSPRPR A 
LPERHGGRAALVHRGQEP 
SLNDMGAVLRWFTEAKSR 

VLQRCVPRGQPVQGPPAA 
CWSVACRVGRRSRGPHRP 
AGVS PVGSAGAPGARTAR 

CCG TGG TTG ACT GCC GTG TGG CCT GCG GGG ACG CCC TGG ACG GGC CCA CCG CGC 
48393 48402 48411 48420 48429 48438 

GGC ACC AAC TGA CGG CAC ACC GGA CGC CCC TGC GGG ACC TGC CCG GGT GGC GCG 

GTN*RHTGRPCGTCPGGA 
APTDGTPDAPAGPARVAR 
HQLTAHRTPLRDLPGWRG 

SRLLDGVLVPPVEADDPH 
VGSCIVWSSPRCKLMMPT 
CEPAS*GRPRAAS*C*RP 



CGT GAG GCC TCG TCT AGT GGG TGC TCC TGC CCG CCG TGA AGT CGT AGT AGC CCC 
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48*447 48456 48465 48474 48483 " 4849 2 

GCA CTC CGG AGC AGA TCA CCC ACG AGG ACG GGC GGC ACT TCA GCA TCA TCG GGG 



ALRSRSPTRTGGTSAS SG 
HSGADHPRGRAALQHHRG 
TPEQ I THEDGRHFS I IGV 

GGLDTVALHGFPVLRQQE 
VAWTPSRSTASHSWGSSN 
SRGPRHGRPPRI PGAAAT 

ACT GGC GGG TCC AGC CAC TGG CGC TCC ACC GGC TTA CCC TGG TCG GCG ACG ACA 
48501 4851 0 4851 9 48528 48537 48546 

TGA CCG CCC AGG TCG GTG ACC GCG AGG TGG CCG AAT GGG ACC AGC CGC TGC TGT 

*PPRSVTARW PNGTSRCC 
DRPGR * PRGGRMGPAAAV 
TAQVGDREVAEWDQPLLF 

RLPASDDREHDLDDFPDR 
GCPRPTTANTILTMS PTA 
GAPARLRRTRS*P*RLPR 

AGG GCG TCC CCG CGC CTC AGC AGC GCA AGC ACT AGT TCC AGT AGC TTC CCC AGC 
48555 48564 48573 48582 48591 48600 

TCC CGC AGG GGC GCG GAG TCG TCG CGT TCG TGA TCA AGG TCA TCG AAG GGG TCG 

SRRGAESSRS*SRSSKGS 
PAGARSRRVRDQGHRRGR 
PQGRGVVAFVIKVIEGVA 

VQEDVGPELGAQQVAHLH 
CRSTWARNWGPRSSPMS I 
AGARGRGTGARGAPRCPS 

GCG TGG ACG AGC AGG TGC GGG CCA AGG TCG GGC CGG ACG ACC TGC CGT ACC TCT 
48609 48618 48627 48636 48645 48654 

CGC ACC TGC TCG TCC ACG CCC GGT TCC AGC CCG GCC TGC TGG ACG GCA TGG AGA 

RTCS STPGSSPACWTAWR 
APAR P R P VPAR P A GR H G D 

HLLVHARFQPGLLDGMEM 

ARGHLADRLVIRLPRRPE 
PGVT CHTGSF*GCPGGRN 
PGSRATRGPSSDALAAAT 

ACC CGG GCT GGC ACG TCA CGC AGG GCC TCT TGA TAG GCG TTC CCG GCG GCG CCA 
48663 48672 48681 48690 48699 48708 

TGG GCC CGA CCG TGC AGT GCG TCC CGG AGA ACT ATC CGC AAG GGC CGC CGC GGT 

WARPC SASRRTIRKGR RG 
GPDRAVRPGELSARAAAV 
GPTVQCVPENYPQGPPRF 

E V ; V D Q G S G R L A E E V T G D Q 
RS * TRVAEGSRRR*LATR 
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AGG AGC TGA TGC AGG ACT GGC GAA GGG GCC TCG CGG AGG AGA TGT CAC GGC AGG 
48717 48726 48735 48744 48753 48762 

TCC TCG ACT ACG TCC TGA CCG CTT CCC CGG AGC GCC TCC TCT ACA GTG CCG TCC 

SSTTS*PLPRSASSTVPS 
PRLRPDRFPGAPPLQCRP 
LDYVLTASPERLLYSAVL 

GLLAPAEVVRLVAIEQDL 
ASSPPRK*WECFL*RRT S 
PRPPRASRGSASCSDGPR 

ACC GGC TCC TCC CGC CCG CGA AGA TGG TGA GCG TCT TGT CGA TAG AGG ACC AGC 
48771 48780 48789 48798 48807 48816 

TGG CCG AGG AGG GCG GGC GCT TCT ACC ACT CGC AGA ACA GCT ATC TCC TGG TCG 

WPRRAGASTTRRTAI SW S 
GRGGRAL LPLAEQL S P G R 
AEEGGRFYHSQNSYLLVE 

GVVVEGYGDGIVVAPHGG 
ASSSKGTATGSS*QQTVA 
PRRRSGRLRGRHSSSPSR 

TCC GGC TGC TGC TGA AGG GGC ATC GGC AGG GGC TAC TGA TGA CGA CCC ACT GGC 
48825 48834 48843 48852 48861 48870 

AGG CCG ACG ACG ACT TCC CCG TAG CCG TCC CCG ATG ACT ACT GCT GGG TGA CCG 

RPTTTSP *PSPMTTAG* P 
GRRRLPR.SRPR*LLLGDR 
ADDDFPVAVPDDYCWVT A 

VLEGPEQPVAVVDVDLGP 
WWSVRSRRCP**TLTSAR 
GGA*GAGAARSSR*RRPG 

GGG TGG TCG AGT GGG CCG AGG ACG CCG TGC CGA TGA TGC AGT TGC AGC TCC GGG 
48879 48888 48897 48906 48915 48924 

CCC ACC AGC TCA CCC GGC TCC TGC GGC ACG GCT ACT ACG TCA ACG TCG AGG CCC 

PTSSPGSCGTATTSTSRP 
PPAHPAPAA RLLRQRRGP 
HQLTRL LRHGYYVNVEAR 

AQEGAQLTPSGMFFSRGT 
LRSAQRCLQHGWS SRAD R 
SGARRGASNTVGHLVLT G 

CCT CGG ACG AGC GGA CGG ACG TCT CAA CCA CTG GGG TAC TTC TTG CTC GCA GGG 
48933 48942 48951 48960 48969 48978 

GGA GCC TGC TCG CCT GCC TGC AGA GTT GGT GAC CCC ATG AAG AAC GAG CGT CCC 

GACSPACRVGDP (m) K N E R P 
EP ARLPAELVTP * R T SV P 
S L L A C L Q SW*PHEER A S R 

-191- ^ 



RSPMRPQESMARRRVRGA 
AAPCERS SRCRGVGYGAP 
HPQANEAAGVDGSATGQR 

CAC GCC GAC CCG TAA GAG CCG ACG AGG CTG TAG CGG GCT GCG GCA TGG GAC GGC 
48987 48996 49005 49014 49023 49032 

GTG CGG CTG GGC ATT CTC GGC TGC TCC GAC ATC GCC CGA CGC CGT ACC CTG CCG 

VRLGILGCSDIARRRTLP 
CGWAFSAAPTSPDAVPCR 
AAGHSRLLRHRPTPYPAG 

ASFTGS SVTVATAERL S S 
RASPAPASPSRRRRGSRP 
GRQLHRLQRHGGDGGPAL 

CGG CGC GAC TTC CAC GGC CTC GAC TGC CAC TGG CGG CAG CGG AGG GCC TCG CTC 
49041 49050 49059 49068 49077 49086 

GCC GCG CTG AAG GTG CCG GAG CTG ACG GTG ACC GCC GTC GCC TCC CGG AGC GAG 

AALKVP ELTVTAVASR S E 
PR*RC RS*R*PPSPPGAR 
RAEGA GADGDRRRLPERG 

LARATAARNPPSATTP* S 
CRGHPRRATRRRPRRRS R 
VVGTRD GRPEAALGDDAV 

CTG TTG CGG GCA CGC CAG CGG CGC GCC AAG CCG CCG CTC CGG CAG CAG CCG ATG 
49095 49104 49113 49122 49131 49140 

GAC AAC GCC CGT GCG GTC GCC GCG CGG TTC GGC GGC GAG GCC GTC GTC GGC TAC 

DNARAVAARFGGEAVVGY 
TTPVRSPRGSAARPSSAT 
QRPCGRRAVRR RGRRRLR 

ASSSLGSTSAT* TERGVP 
PAAPSGPHRRP RRRGAWR 
LRQQLARIDVRDVDGQGG 

CTC CGC GAC GAC CTC TCG GGC CTA CAG CTG CGC CAG ATG CAG AGG GAC GGG TGG 
49149 49158 49167 49176 49185 49194 

GAG GCG CTG CTG GAG AGC CCG GAT GTC GAC GCG GTC TAC GTC TCC CTG CCC ACC 

EALLESPDVDAVYVSLPT 
RRCWRARMSTRSTSPCPP 
GAAGEPGCRRGLRLPAHR 

SCWSQI TRARRAPFCT S A 
V A G R S S RARGAR P FAR A R 
SQ VVVPDHAGQARSLVHE 



CCT GAC GTG GTG CTG ACC TAG CAC GCG 
49203 49212 49221 

GGA CTG CAC CAC GAC TGG ATC GTG CGC 



CGG GAC GCG CGC CCT TTC GTG CAC GAG 
49230 49239 49248 

GCC CTG CGC GCG GGA AAG CAC GTG CTC 
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G. I*- Hi H 0 W I' V" R A L R- A- G" " " K ; H * V L 
DCTTTGSCAPCARE ST CS 
TAPRLDRARPARGKARAR 

SFGSVAR* GSVTVATRRA 
PSAASRGSGPCRSPPGGR 
RLLRQGGAVRVGHRRDAE 

CGC CTC TTC GGC GAC TGG CGG GCG ATG GGC CTG TGG CAC TGC CGC CAG GCG GAG 
49257 49266 49275 49284 49293 49302 

gcg gag aag ccg ctg acc gcc cgc tac ccg gac acc gtg acg gcg gtc cgc ctc 

aekpltarypdtvtavrl 
r rsr* ppatrtp * rrs as 
geaadrplpg'hrdggppr 

serprvsisfrvkvwces 
psgrgsaspsgsr*gasa 
rvgaaqrqhlvqgeglvr 

CGC CTG AGG GCG CCG GAC TGC GAC TAC CTC TTG GAC TGG AAG TGG GTC GTG AGC 
49311 49320 49329 49338 49347 49356 

GCG GAC TCC CGC GGC CTG ACG CTG ATG GAG AAC CTG ACC TTC ACC CAG CAC TCG 

ADSRGLTLMENLTFTQHS 
RTPAA*R*WRT*PSPSTR 
GLPRPDADGEPDLHPALA 

CSATRSISSSPPMPSSRE 
ARRRARSAPRPRCRHVAS 
QVVGHALHQVLAADTFQA 

GAC GTG CTG CGG CAC GCG CTC TAC GAC CTG CTC CCG CCG TAG CCA CTT GAC GCG 
49365 49374 49383 49392 49401 49410 

CTG CAC GAC GCC GTG CGC GAG ATG CTG GAC GAG GGC GGC ATC GGT GAA CTG CGC 

LHDAVREMLDEGG I GELR 
CTTPCARCWTRAASVNCA 
ARRRARDAGRGRHR* TAL 

RVLSNPNGGSGGPLTRYW 
G*WRTR. TGAVAE RCRGTG 
GEGALEPERWQRGAVDPV 

AGG GAG TGG TCG CTC AAG CCC AAG GGC GGT GAC GGA GGG CCG TTG CAG GCC ATG 
49419 49428 49437 49446 49455 49464 

TCC CTC ACC AGC GAG TTC GGG TTC CCG CCA CTG CCT CCC GGC AAC GTC CGG TAC 

SLTSEFGFPPLPPGNVRY 
PSPASSGSRHCLPATSGT 
PHQRVRVPATASRQRPVP 

GSSAPPLRSSAPTYGSAA 
APAPRRCGAPRPRTDARR 
LRLQGAAAQQVRAHIREG 



GTC GGC CTC GAC CGG CCG CCG TCG GAC GAC CTG CGC CCG CAC ATA GGC GAG CGG 
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49473 49482 4949T 49500" 495V9 4 9 5T8 

CAG CCG GAG CTG GCC GGC GGC AGC CTG CTG GAC GCG GGC GTG TAT CCG CTC GCC 



QPELAGGSLLDAGVYPLA 
SRSWPAAACWTRAC I RSP 
AGAGRRQPAGRGRVSARR 

ALMNRPGSRSTTPAVSR I 
PSCTGRARGRHPRP SAAS 
RRAHEEPGVEIHDPRRQp 

CGC CGC TCG TAC AAG GAG CCC GGG CTG GAG CTA CAC CAG CCC CGC TGC GAC GCC 
49527 49536 49545 49554 49563 49572 

GCG GCG AGC ATG TTC CTC GGG CCC GAC CTC GAT GTG GTC GGG GCG ACG CTG CGG 

AASMFLGPDLDVVGATLR 
RRACSSGPTSMWSGRRCG 
GEHVPRARPRCGRGDAAD 

PVSA FTSTAPSASSHAGS 
PFRP SLRRPPRRAAT HAR 
HSGLRFDVHRAVRQQTRG 

TAC CCT TGG CTC CGC TTT CAG CTG CAC CGC CCG CTG CGC GAC GAC ACA CGC GGG 
49581 49590 49599 49608 49617 49626 

ATG GGA ACC GAG GCG AAA GTC GAC GTG GCG GGC GAC GCG CTG CTG TGT GCG CCC 

MGTEA KVDVAGDAL L CAP 
WEPRRKS TWRATRCCVRP 
GNRGE SRRGGRRAAV CAR 

PRVACTDKPKSCA* R Q AY 
RGCPVRTRRSRARRGSRT 
VAARCVHGEAELVGVAAR 

CTG CCG GCG TGC CGT GTG CAC AGG AAG CCG AAG CTC GTG CGG ATG GCG ACG CGC 
49635 49644 49653 49662 49671 49680 

GAC GGC CGC ACG GCA CAC GTG TCC TTC GGC TTC GAG CAC GCC TAC CGC TGC GCG 

DGRTAHVSFGFEHAYRCA 
TAARHTCPSASSTP TAAR 
RPHGTRVLRLRARLPLRV 

VSHPLSPRIMTSRAKVGG 
CATPSRPGS*RRGHR * GA 
VRQPPALAPDDDVTGEGR 

ATG TGC GAC ACC CCC TCG CTC CCG GCC TAG TAG CAG CTG GCA CGG AAG TGG GGC 
49689 49698 49707 49716 49725 49734 

TAC ACG CTG TGG GGG AGC GAG GGC CGG ATC ATC GTC GAC CGT GCC TTC ACC CCG 

YTLWGSEGRI IVDRAF TP 
TRCGGARAGSSSTVP SPR 
HAVGERGPDHRRPCL HPA 

G S & K RGVTRSSRASSTRSR 
AR SGGWPEAPVRRRPARA 
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GGC GGG CTG AAG GCG GGG TGC CAA GCC GAC CTT GCG CGG CTG CTC CAC GCG CTC 
49743 49752 49761 49770 49779 49788 

CCG CCC GAC TTC CGC CCC ACG GTT CGG CTG GAA CGC GCC GAC GAG GTG CGC GAG 

PPDFRPTVRLERADEVR E 
RPTSAPRFGWNAPTRCAS 
ARLPPHGSAGTRRRGARA 

TRGAS SWNAPVRAHKTRA 
RGAP RR GTRRC GRT S R G .P 
ADQRGVVLEGAGERAEDP 

GCG CAG GAC GGC CGG CTG CTG GTC AAG CGG CCG TGG GAG CGC ACG AAG CAG GCC 
49797 49806 49815 49824 49833 49842 

CGC GTC CTG CCG GCC GAC GAC CAG TTC GCC GGC ACC CTC GCG TGC TTC GTC CGG 





CGG CAG TGG CCG CCG CCC AGC CGC CGC GTG TCG CGG CTA CAG TAG CGT GCC CGG 
49851 49860 49869 49878 49887 49896 

GCC GTC ACC GGC GGC GGG TCG GCG GCG CAC AGC GCC GAT GTC ATC GCA CGG GCC 

AVTGGGSAAHSADVI ARA 
PSPAAGRRRTAPMSSHGP 
RHRRRVGGAQRRCHRT GP 

NTL*TCPRARSSPLPQDP 
IPLDPAPGPVAARCRST L 
SQYTLHLAPCPQEAVAP * 

GCT AAC CAT TCA GTC CAC GTC CCG GCC CGT GCC GAC GAG CCG TTG CCG ACC AGT 
49905 49914 49923 49932 49941 49950 

CGA TTG GTA AGT CAG GTG CAG GGC CGG GCA CGG CTG CTC GGC AAC GGC TGG TCA 




CCT CCT CGT CTA CCG GCT ACT CGC GCT CGC GCA AGA GCA CCG ACC ACC CTG CCC 
49959 49968 49977 49986 49995 50004 

GGA GGA GCA GAT GGC CGA TGA GCG CGA GCG CGT TCT CGT GGC TGG TGG GAC GGG 



GGADGR*ARARSRGWWD G 
EE^QMADERERVLVA G^ GTG 
RS RWPMSASAFSWL (v) G R G ^ElT * 



RPGDATRPGSRPRLRPPP 
EHATLQARVQGRGSGLHR 
N T P R * SHASRVAAPAS TA 



CAA GCA CCC GGC AGT CGA CAC GCG CCT GGA CTG GCG CCG GCC TCG GCT CCA CCG 
50013 50022 50031 50040 50049 50058 

GTT CGT GGG CCG TCA GCT GTG CGC GGA CCT GAC CGC GGC CGG AGC CGA GGT GGC 



VRGPSAVRGPDRGRSRGG 
FVGRQLCADLTAAGAEVA 
SWAVSCART*PRPEPRWR 




CCG CTA GCG GGC CGC CCA TGG CCT GAA GGG GGA CGG CCC GGC CGA GGA GCA GGA 
50067 50076 50085 50094 50103 50112 

GGC GAT CGC CCG GCG GGT ACC GGA CTT CCC CCT GCC GGG CCG GCT CCT CGT CCT 

GDRPAGTGLPPAGPAPRP 
AIARRVPDFPLPGRLLVL 
RSP GGYRTSPCRAGS S SW 

R*WRTARPVPRRSRSRGG 
VDGGRRGPFQGVHDVGDA 
STVVADGPSSASTISETR 



CCT GCA GTG GTG GCG CAG CGG GCC CCT TGA CCG GCT GCA CTA GCT GAG GCA GGC 
50121 50130 50139 50148 50157 50166 

GGA CGT CAC CAC CGC GTC GCC CGG GGA ACT GGC CGA CGT GAT CGA CTC CGT CCG 

GRHHRVARGTGRRDRLRP 
DVTT ASPGELADVIDSVR 
TSPPRRPGNWPT*STPSA 

ACPP*RWRCCSPSRRVPC 
RVRHDVGDAAVP PDGFPV 
GCVTTLAMPLLQP IASRS 

GGG CGT GTG CCA CCA GTT GCG GTA GCC GTC GTT GAC CCC CTA GCG GCT TGC CCT 
50175 50184 50193 50202 50211 50220 

CCC GCA CAC GGT GGT CAA CGC CAT CGG CAG CAA CTG GGG GAT CGC CGA ACG GGA 

PA HGGQRHRQQLGDRRTG 
PHTVVNAIGSNWGIAERD 
RTRWSTP SAATGGSPNGT 

PSWSRPASGGGAPRAAAS 
HLGVARHRGAAQQVRQPP 
MSVLQATGVRRRS SASRR 

GTA CCT CTG GTT GAC GCG CCA CGG CTG GGC GGC GGA CGA CCT GCG CGA CGC CGC 
50229 50238 50247 50256 50265 50274 

CAT GGA GAC CAA CTG CGC GGT GCC GAC CCG CCG CCT GCT GGA CGC GCT GCG GCG 
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METNCAVPTRRLLDALRR 
WRPTARCRPAACWTRC G < 



RTGDRRRGGRSLAPTRGi 
GRATGVDDVEA*HQLVAR 
VAHRG*TTWRPETSSYPG 



CTG GCG CAC GGC AGG GAT GCA GCA GGT GGA GCC GAG TCA CGA CCT CAT GCC GGG 
50283 50292 50301 50310 50319 50328 

GAC CGC GTG CCG TCC CTA CGT CGT CCA CCT CGG CTC AGT GCT GGA GTA CGG CCC 



d rvpslrrpprlsagvrp 
tacrpyvvhlgsvleygp 
pravptsstsaqcwsta: 



GARHVSGSRTAAGAS SRI 
GRGTFRGPGRRRGPRRGG 
VGGPSGVRVADGGRGVVA 

CTG GGG CGG GCC ACT TGG CTG GGC CTG GCG CAG CGG CGG GGC CGG CTG CTG GCG 
50337 50346 50355 50364 50373 50382 

GAC CCC GCC CGG TGA ACC GAC CCG GAC CGC GTC GCC GCC CCG GCC GAC GAC CGC 

DPAR* TDPDRVAAPADDR 
TPPGEPTR TASPPRPTTA 
PRPVNRP GPRRRP GRRP ] 

RCPWVRPSGPRAPPRRP] 
VALGFERRALGHQLGGRL 
* P L A L SAALWAT S SAAAS 

GAT GCC GTT CCG GTT TGA GCG CCG CTC GGT CCG GCA CGA CCT CCG GCG GCG CCT 
50391 50400 50409 50418 50427 50436 

CTA CGG CAA GGC CAA ACT CGC GGC GAG CCA GGC CGT GCT GGA GGC CGC CGC GGA 




CCC GCA GCA CCT CCG CCC GCA CGA CGC 
50445 50454 50463 

GGG CGT CGT GGA GGC GGG CGT GCT GCG 



CTA GCG GTT GCA CCG GCC CGG CCC GTG 
50472 50481 50490 

GAT CGC CAA CGT GGC CGG GCC GGG CAC 




GGG CCG CCA GTC GGA CGA GCC GGC CCA CCG GCC CGC CGA GCG GCT CCG CCA GTG 
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50499. . 50508 ' 505T7" 5052& SO 5 3 5" * 5 0544 

CCC GGC GGT GAG CCT GCT CGG CCG GGT GGC CGG GCG GCT CGC CGA GGC GGT CAC 



PGGQPARPGGRAARRGGH 
PAVSL. LGRVAGRLAEAVT 
RRSACSAGWPGGSPRR s P 

PCAGPPRPATGTARGGRS 
PVHERRDHLQGLQAGVAV 
RSMSGATTSSDWNRAWRS 

GGC CCT GTA CGA GGG CCG CCA GCA CCT CGA CAG GGT CAA CGC GCG GGT GGC GCT 
50553 50562 50571 50580 50589 50598 

CCG GGA CAT GCT CCC GGC GGT CGT GGA GCT GTC CCA GTT GCG CGC CCA CCG CGA 

PGHAPGGRGAVPVARPPR 
RDMLPAVVELSQLRAHRD 
GTCSRRSWS CPSCAPTAT 

RRRARRRPRPAPRWGRG Y 
VDVHAVDRVRHQGGGAGT 
*TSTRSTESATSAAVRAR 



GAT GCA GCT GCA CGC GCT GCA GAG CCT GCG CCA CGA CCG GCG GTG GGC GCG GGC 
50607 50616 50625 50634 50643 50652 

CTA CGT CGA CGT GCG CGA CGT CTC GGA CGC GGT GCT GGC CGC CAC CCG CGC CCG 

LRRR ARRLGRGAGRHPRP 
YVDV RDVSDAVLAATRAR 
TSTCATSRTRCWPPPAPV 



EPAPRGWRVRRPRAPATA 
NRPQDDGDSAALGHRHPP 
IGPSTTGMPRPSATGTRH 



ATA AGG CCC CGA CCA GCA GGG GTA GCC TGC GCC GCT CCG GCA CGG CCA CGC CAC 
50661 50670 50679 50688 50697 50706 

TAT TCC GGG GCT GGT CGT CCC CAT CGG ACG CGG CGA GGC CGT GCC GGT GCG GTG 





CGA GCA GCT AGA CGA GCA GCT CCA CTC GCC GCA CGG GCG GCT CCA GGC CCT CGA 
50715 50724 50733 50742 50751 50760 

GCT CGT CGA TCT GCT CGT CGA GGT GAG CGG CGT GCC CGC CGA GGT CCG GGA GCT 

ARRSARRGERRARRGPGA 
LVDLLVEVSGVPAEVREL 
SSICSSR*AACPPRSG SF 

R R _R WPRPRPRSSGPRGRA 
GGGGRARGPVVPD LDVGP 
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AGG GCG GCG GCG GTG CCC GCG CCG GCC CCT GCT GAC CTA GGT CCA GCT GGG GCC 
50769 50778 50787 50796 50805 50814 

TCC CGC CGC CGC CAC GGG CGC GGC CGG GGA CGA CTG GAT CCA GGT CGA CCC CGG 

SRRRHGRGRGRLDPGRPR 

PAAATGAAGDDWIQVDPG 
PPPPRARPGTTGSRS TPG 

RGRVGRSSRRGSAARTPS 
GGAFEEAPGGD. ARQVLRH 
GARS SRPQVATRE SC SDT 

CGG GCG GGC GCT TGA GGA GCC GAC CTG GCG GCA GGC GAG CGA CGT GCT CAG CCA 
50823 50832 50841 50850 50859 50868 

GCC CGC CCG CGA ACT CCT CGG CTG GAC CGC CGT CCG CTC GCT GCA CGA GTC GGT 

ARPRTPRLDRRPLAARVG 
PARELLGWTAVRSLHESV 
PPANSSAGPPSARCT S R * 

RATPRCAACAPLGGARPA 
GPQPGVRQAPLCDGLVRL 
VPSHASVSRLCAI GWCAS 

CTG GCC CGA CAC CCG GCT GTG CGA CGC GTC CGT CCG TTA GGG GGT CGT GCG CCT 
50877 50886 50895 50904 50913 50922 

GAC CGG GCT GTG GGC CGA CAC GCT GCG CAG GCA GGC AAT CCC CCA GCA CGC GGA 

D RAVGRHAAQAGNPPARG 
TGLWADTLRRQAI PQHAE 
PGCGPTRCAGRQSPS TRS 

AATRPGTTLNGDAAGGAR 
RPRGLGQR* IGTQRAARG 
GRGD *ARDDSERRGRRGG 

CGG CGC CGG CAG GAT CCG GGA CAG CAG TCT AAG GGC AGA CGG CGC GGC GGG CGG 
50931 50940 50949 50958 50967 50976 

GCC GCG GCC GTC CTA GGC CCT GTC GTC AGA TTC CCG TCT GCC GCG CCG CCC GCC 

AAAVL GPVVRFP SAAP PA 
PRPS*ALSSDSRLPRRPP 
RGRPRPCRQIPVCRAARP 

RAS SPFEVVPGLPRRAFG 
GPPRRSNSSLAWRAARLA 
EPRVVPIRRCPGAPPACL 

GAG GCC CGC CTG CTG CCC TTA AGC TGC TGT CCC GGG TCG CCC GCC GCG CGT TTC 
50985 50994 51003 51012 51021 51030 

CTC CGG GCG GAC GAC GGG AAT TCG ACG ACA GGG CCC AGC GGG CGG CGC GCA AAG 

LRADDGNSTTGPSGRRAK 
SG RT T GIRRQGPAG GAQ S 
P G ~GR R E F D D RAQ R A A R K A 
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FARSQVAGSWVDGHGELH 
LRGLSSRVVGCTGTGRLT 
WVGSVPGCWEVRGRAG*P 

GGT TTG CGG GCT CTG ACC TGG CGT GGT GAG GTG TGC AGG GGC ACG GGG AGT TCC 
51039 51048 51057 51066 51075 51084 

CCA AAC GCC CGA GAC TGG ACC GCA CCA CTC CAC ACG TCC CCG TGC CCC TCA AGG 

PNARDWTAPLHTSPCPSR 
QTPETGPHH .STRPRAPQG 
KRPRLDRTTPHVPVP LKV 

*RRGAARRRTRGCWRVGA 
DGGGPPVGGRVGAGA SAQ 
TVAARR CAEAYARVL P RR 

ACA GTG GCG GCG GGC CGC CGT GCG GAG GCG CAT GCG GGC GTG GTC GCC TGC GGA 
51093 51102 51111 51120 51129 51138 

TGT CAC CGC CGC CCG GCG GCA CGC CTC CGC GTA CGC CCG CAC CAG CGG ACG CCT 

CHRRPAARLRVRPHQRTP 
VTAARRHASAYART S GRL 
SPPPGGTPPRTPAPADAC 



T R G A — G R W ~P S G A R R S G "A Y R~ 

RGGPAVGPRVPEALARTG 
GDERRWALAFRSPSLGRV 

CGG CAG GAG GGC CGC GGT GCG GTC CCG CTT GGC CGA GCC GCT CTC GGG CGC ATG 
51147 51156 51165 51174 51183 51192 

GCC GTC CTC CCG GCG CCA CGC CAG GGC GAA CCG GCT CGG CGA GAG CCC GCG TAC 

AVLPAPRQGEPARRE PAY 
PSSRRHARANRLGES PRT 
RPPGATPGRTGSARARVP 

VPR*GASAS*RPTARRWS 
SPDDGRRPQDAPRQGDGR 
PRTTVGGLSI LPANGTAV 

GCC TGC CCA GCA GTG GGG CGG CTC CGA CTA GTC GCC CCG CAA CGG GCA GCG GTG 
51201 51210 51219 51228 51 237 51246 

CGG ACG GGT CGT CAC CCC GCC GAG GCT GAT CAG CGG GGC GTT GCC CGT CGC CAC 

RTGRHPAEADQRGVARRH 
GRVVTPPRLISGALPVAT 
DGSSPRRG*SAGRCPSPR 

ASASGQSWPSRPTCLCI G 
PLHRARRGPAERRVSASA 
LCIGLGAVLPKEAYLPLH 

CTC CGT CTA CGG CTC GGG ACG CTG GTC CCC GAA GAG CCG CAT GTC TCC GTC TAC 
51255 51264 51273 51282 51291 51300 

GAG GCA GAT GCC GAG CCC TGC GAC CAG GGG CTT CTC GGC GTA CAG AGG CAG ATG 
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LGAVLPKEAYLPV FNTR 
SGQSWPSRPTCRFSTRGP 
RARRGPAERRVASRLEDQ 



GGC TCG GGA CGC TGG TCC CCG AAG AGC CGC ATG TCG CCT TGC TTC AAG CAG GAC 
51309 51318 51327 51336 51345 51354 

CCG AGC CCT GCG ACC AGG GGC TTC TCG GCG TAC AGC GGA ACG AAG TTC GTC CTG 

PSPATRGFSAYSGTKFVL 
RALRPGASRRTAERS S SW 
EPCDQGLLGVQRNEVRPC 

PRDSPSASSTASKPMLTJ 
PGTRPARPRP RRSRC * PA 
LAQGLPERVLDGVEADLH 

CTC CCG GAC AGG CTC CCC GAG CGC CTG CTC CAG CGQ CTG AAG CCG TAG TTC CAC 
51363 51372 51381 51390 51399 51408 

GAG GGC CTG TCC GAG GGG CTC GCG GAC GAG GTC GCC GAC TTC GGC ATC AAG GTG 

EGLSEGLADEVADFG I KV 
RACPRGSRTRSPTSASRC 
GPVRGARGRGRRLRHQ G i 

ITSGPEKRVESNSVPRA] 
SRRAPNRG CRATRSPVPR 
QDDLRTGEAGRQELR S PG 

GAC TAG CAG CTC GGC CCA AGG AAG GCG TGG AGC GAC AAG CTC TGC CCT GCC CGG 
51417 51426 51435 51444 51453 51462 

CTG ATC GTC GAG CCG GGT TCC TTC CGC ACC TCG CTG TTC GAG ACG GGA CGG GCC 

LIVEPGSFRTSLFETGRA 
*SSSRVPSAPRCSRRDGP 
DRRAGFLPHLAVRDGTG3 

ALVS LPRYGFTLRVRPK' 
PWCPCRGTGSPSGSGRSR 
PGARVAAQVRLHAPGAAE 

CCC CGG TCG TGC CTG TCG CCG GAC ATG GGC TTC CAC TCG GCC TGG GCG CCG AAG 
51471 51480 51489 51498 51507 51516 

GGG GCC AGC ACG GAC AGC GGC CTG TAC CCG AAG GTG AGC CGG ACC CGC GGC TTC 

GASTDSGLYPKVSRTRGF 
GPARTAACTRR*AGPAAS 
GQHGQRPVPEGEPDPRLI 

EPPSPEWGPSGAFAAAS 3 
RRRRRS GARRGPSPP P AS 
DGAAVAGLGAVRRLRRRQ 

CAG AGG CCG CCG CTG CCG AGG GTC GGG CCG CTG GGC CGC TTC CGC CGC CGC GAC 

-201 - 



51 525 51534 51 54 51 S5T 51 5S1 51570 

GTC TCC GGC GGC GAC GGC TCC CAG CCC GGC GAC CCG GCG AAG GCG GCG GCG CTG 



VSGGDGSQPGDPAKAAAL 
SPAATAPSPATRRRRrr* 

LRRRRLPARRPGEGGGA I 

RAASSASSVGSRSGNPS2 
GPRAPPPRSGAAAATPRR 

DQGRQLRVLGRQPQRQAV 

TAG GAC CGG CGC GAC CTC CGC CTG CTC TGG GGC GAC GCC GAC GGC AAC CCG CTG 
51579 51588 51597 51606 51615 51624 

ATC CTG GCC GCG CTG GAG GCG GAC GAG ACC CCG CTG CGG CTG CCG TTG GGC GAC 

ILAALEADETPLRLPLGD 
SWPRWRRTRPRCGCRWAT 
PGRAGGGRDPAAAAVGRI 

PTVATSP*RS*TRLSMV^ 
RP*QRARDGRDPACRC*S 
VPDSGHETVEILHAVVDR 

CTG CCC CAG TGA CGG CAC GAG CCA GTG GAG CTA GTC CAC GCG TTG CTG TAG TGC 
51633 51642 51651 51660 51669 51678 

GAC GGG GTC ACT GCC GTG CTC GGT CAC CTC GAT CAG GTG CGC AAC GAC ATC ACG 

DGVTAV LGHLDQVRND IT 
TGSLPCSVTSIRCATT SR 
RGHCRARSPRSGAQRHHI 

HSFRVLAVPKSSQPWRGI 
TPSASWPSPSRRSLGGAA 
RPLLPGPRRAEVVSAVPR 

TGC ACC CTC TTC GCC TGG TCC CGC TGC CCG AAG CTG CTG ACT CCG GTG GCC GGC 
51687 51696 51705 51714 51723 51732 

ACG TGG GAG AAG CGG ACC AGG GCG ACG GGC TTC GAC GAC TGA GGC CAC CGG CCG 

TWEKRTRATGFDD * GHRP 
RGRSGP GRRASTTEAT GR 
VGEADQGDGLRRLRPPAi 

LLPQPAGFGGGVRAEMS £ 
CFLNPPASDAG*GRKWPP 
AFSTPPRR IRGRGE SGHL 

GCG TTT TCT CCA ACC CCC CGC GGC TTA GGC GGG GGA TGG GAG CGA AGG TAC CTC 
51741 51750 51759 51768 51777 51786 

CGC AAA AGA GGT TGG GGG GCG CCG AAT CCG CCC CCT ACC CTC GCT TCC ATG GAG 

RKRGWGAPNPPPTLASME 
AKEVGGRRIRPLP SLPWR 
QKRLGGAESAPYPRFHGC 

SC _LTQ S TLSPM*AVC S C 2 
LASRRP LLARCRRWAPVP 
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CTT CTC GTC TCG CAG ACC CTT CAT TCC 
51795 51804 51813 

GAA GAG CAG AGC GTC TGG GAA GTA AGG 



GAG CCG TAG ATG CGG TGC GTC CTT GTC 
51822 51831 51840 

CTC GGC ATC TAC GCC ACG CAG GAA CAG 




CGC CTG CTC TAG TTC CTT GTC TAG CAG TCC GAG GAG ACG GGC CTG GGG CTA GTG 
51849 51858 51867 51876 51885 51894 

GCG GAC GAG ATC AAG GAA CAG ATC GTC AGG CTC CTC TGC CCG GAC CCC GAT CAC 

ADEIKEQIVRLLCPDPDH 
RTRSRNRSSGSSARTPI T 
GRDQGTDRQAPLPGPRSR 

GGQGTGHDTMISRSQSAY 
GARGPGTTP*SAARSRRT 
GRGARDRPRDHHQAVAVR 



CGG GGC GGG ACG GGC CAG GGC ACC AGC CAG TAC TAC GAC GCG CTG ACG CTG CGC 
51903 51912 51921 51930 51939 51948 

GCC CCG CCC TGC CCG GTC CCG TGG TCG GTC ATG ATG CTG CGC GAC TGC GAC GCG 

APPCPVPWSVMMLRDCDA 
PRPARSRGR S*CCATATR 
PALPGPVVGHDAARLRRV 

GSSRSCALISCSRQAPRD 
DPVAPAPWSRVPGNLRGI 
IRFQPLLGPDFLVT S GAS 

ATA GGC CTT GAC GCC CTC GTC CGG TCC TAG CTT GTC CTG GCA ACT CGG CCG GCT 
51957 51966 51975 51984 51993 52002 

TAT CCG GAA CTG CGG GAG CAG GCC AGG ATC GAA CAG GAC CGT TGA GCC GGC CGA 

YPELREQARIEQDR*AGR 
IRNCGSRPGSNRTVEPAD 
SGTAGAGQDRTGPL SRP I 

RGEVPRSPRPGGALRRLA 
EAKLRDAQGLAGR S GVYL 
RPR*GTPKASPGGRASTS 



AGA GCC GGA AGT TGG CCA GCC GAA CCG GCT CCC GGG GGG CGC TCG GCT GCA TCT 
52011 52020 52029 52038 52047 52056 

TCT CGG CCT TCA ACC GGT CGG CTT GGC CGA GGG CCC CCC GCG AGC CGA CGT AGA 



SRPSTGRLGRGPPASRRR 
L G : Xi Q ' P V G L AEGP P R A D V E 
SAFNRSAWPRAPREPT* S 
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PLHESPPRDDPDGPMGRV 
PCTNARRGI TLTAPCGAC 
RAPTREAASR*PRRADRA 

CGC CCG TCC ACA AGC GAG CCG CCG GCT AGC AGT CCC AGC GGC CCG TAG GGC GCG 
52065 52074 52083 52092 52101 52110 

GCG GGC AGG TGT TCG CTC GGC GGC CGA TCG TCA GGG TCG CCG GGC ATC CCG CGC 

agrcslggrssgspgi pr 
ragvrsaadrqgrrasra 
gqvfarrp ivrvaghpah 

lrrhsgrgpplirsrp sl 
wgdirgggphcsapvr'hs 
gat savgartaphpfat l 

tgg tcg gca gct acg ctg ggg gcg ggc cca ccg tcc tac gcc ctt gcg cca ctc 

52119 52128 52137 52146 52155 52164 

ACC AGC CGT CGA TGC GAC CCC CGC CCG GGT GGC AGG ATG CGG GAA CGC GGT GAG 

T S R R C D P R P G GR <m) R E R G E V/ 
PAVDATPARVAGCGNAVR *\> 
QPSMRPPPGWQDAGT R* e 



PPP AIPRLSRSATARPPR 
PRPRSPASHAPPPPGPRA 
PAPARHP PTLPLRHGPAP 

TCC CCG CCC CCG CGC TAC CCC GCC TCA CTC GCC CTC CGC CAC CGG GCC CCG CCC 
52173 52182 52191 52200 52209 52218 

AGG GGC GGG GGC GCG ATG GGG CGG AGT GAG CGG GAG GCG GTG GCC CGG GGC GGG 

RGGGAMGRSEREAVARGG 
GAGARWGGVSGRRWP GAG 
GRGRDGAE*AGGGGPGRA 

S*SAACATTSS*ARATSA 
AERPPAPPPRRDRVRRRP 

PKVLRRLRHDVIVCAGDL 

GCC GAA GTG CTC CGC CGC GTC CGC CAC CAG CTG CTA GTG CGT GCG CGG CAG CTC 
52227 52236 52245 52254 52263 52272 

CGG CTT CAC GAG GCG GCG CAG GCG GTG GTC GAC GAT CAC GCA CGC GCC GTC GAG 

RLHEAAQAVVDDHAR AVE 
GFTRRRRRWSTITHAPSR 
ASRGGAGGGRRSRTRRRG 

TRAARSGIWSCSARRSSS 
RVPPGPVSGHAVPGARAP 
GYPRGQFRDMLLQGPALQ 

CGG CAT GCC CGC CGG GAC CTT GGC TAG GTA CTC GTT GAC CGG GCC GCG CTC GAC 
52281 52290 52299 52308 52317 52326 

GCC GTA CGG GCG GCC CTG GAA CCG ATC CAT GAG CAA CTG GCC CGG CGC GAG CTG 
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PYGRPWNRSMSNWPGASW 
RTGGPGTDP*ATGPARAG 

TMGTARSDSRVSPLSRRP 
P*GPPGATPG*RPCAAGP 
LDDRHGPQRVEGLAPQAQ 

CTC CAG TAG GGC CAC CGG GCC GAC AGC CTG GAG TGG CTC CCG TCC GAC GCG GAC 
52335 52344 52353 52362 52371 52380 

GAG GTC ATC CCG GTG GCC CGG CTG TCG GAC CTC ACC GAG GGC AGG CTG CGC CTG 

EVIPVARLSDLTEGRLRL 
RSSRWPGCRTSPRAGCAW 
GHPGGPAVGPHRGQAAPG 

STSFPPNRVTPWTSSAPE 
PPPSPRTGSPRGPARRRS 
PLHLLAPEPRDALHEVGA 

CCC CTC CAC CTC TTC CCG CCC AAG GCC TGC CAG CCG GTC CAC GAG CTG CGG CCG 
52389 52398 52407 52416 52425 52434 

GGG GAG GTG GAG AAG GGC GGG TTC CGG ACG GTC GGC CAG GTG CTC GAC GCC GGC 

GEV EKGGFRTVGQVLDAG 
GRWRRAGSGRSARCSTPA 
GGGEGRVPDGRPGARRRL 

YRSRWSRPTPCCVASWVT 
TGAAGAGRPRAASRRGSP 
RVPQALEAPDPLLGGVLR 

AGC ATG GCC GAC GCG GTC GAG GCG CCC CAG CCC GTC GTC TGG CGG CTG GTC TGC 
52443 52452 52461 52470 52479 52488 

TCG TAC CGG CTG CGC CAG CTC CGC GGG GTC GGG CAG CAG ACC GCC GAC CAG ACG 

SYRLRQLRGVGQQTADQT 
RTGCAS SAGSGSRPPTRR 
VPAAPAPRGRAADRRPDG 

AAAWRIASATRSLM ATCM 
PRRGASRRPQVPCCRRVC 
HGGGLPDGLSYPVADGYV 

CAC CGG CGG CGG GTC GCC TAG CGG CTC CGA CAT GCC CTG TCG TAG CGG CAT GTG 
52497 52506 52515 52524 52533 52542 

GTG GCC GCC GCC CAG CGG ATC GCC GAG GCT GTA CGG GAC AGC ATC GCC GTA CAC 

VAAAQRIAEAVRDS IAVH 
WPPPSGSPRLYGTASPYT 
GRRPADRRGCTGQHRRTH 

STSLGSGRVVASTTASCT 
RRPCARAGSWRVPRRAAR 
DVHVPGLGPGGGQDDRQV 



TAG CTG CAC CTG TCC GGG CTC GGG GCC TGG TGG CGT GAC CAG CAG CGC GAC GTG 
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52551 5=2560 52569 52578' 52587 52596 

ATC GAC GTG GAC AGG CCC GAG CCC CGG ACC ACC GCA CTG GTC GTC GCG CTG CAC 



IDVDRPEPRTTALVVALH 
STWTGPSPGPPHWSSRCT 
RRGQARAPDHRTGRRAAR 

STSAPGSARRATSAPPAS 
APPPPGRPVGPRRPPRPA 
HQHLRAGLCAPGDLRAPR 

CAC GAC CAC CTC CGC CCG GGG CTC CGT GCG GCC CGG CAG CTC CGC CCG CCC CGC 
52605 52614 52623 52632 52641 52650 

GTG CTG GTG GAG GCG GGC CCC GAG GCA CGC CGG GCC GTC GAG GCG GGC GGG GCG 

VLVEAGPEARRAVEAGGA 
CWWRRAPRHAGPSRRAGR 
AGGGGPRGTPGRRGGRGA 

VFFSPGSSASAPGAAPRS 
SSSARGAAPRPPAPPLGA 
QRLLEARQQGLRPRRCAP 

GAC TGC TTC TTC GAG CCG GGC GAC GAC CGG CTC CGC CCC GGC CGC CGT CCG GCC 
52659 52668 52677 52686 52695 52704 

CTG ACG AAG AAG CTC GGC CCG CTG CTG GCC GAG GCG GGG CCG GCG GCA GGC CGG 

LTKKL GPLLAEAGPAAGR 
*RRS SARCWPRRGRRQAG 
DE EARPAAGRGGAGGRPA 

RMSNAPRAARPRASAATA 
ACATRPAPRVPVPAPPRP 
QAHQERPPGCPSPRQRGH 

GAC GCG TAC GAC AAG CGC CCC GCC CGG CGT GCC CCT GCC CGC GAC CGC CGG CAC 
52713 52722 52731 52740 52749 52758 

CTG CGC ATG CTG TTC GCG GGG CGG GCC GCA CGG GGA CGG GCG CTG GCG GCC GTG 

LRMLFAGRAARGRALAAV 
CACC SRGGPHGDGRWRPW 
AHAVR GAGRTGTGAGGRG 

SIRASVSCASWSPTGGSS 
PSGRVS RAPRGRRHAVAA 
RLDACQGLLGVVVTHWRQ 

CGC CTC TAG GCG CGT GAC TGG CTC GTC CGG CTG GTG CTG CCA CAC GGT GGC GAC 
52767 52776 52785 52794 52803 52812 

GCG GAG ATC CGC GCA CTG ACC GAG CAG GCC GAC CAC GAC GGT GTG CCA CCG CTG 

AEIRALTEQADHDGVPPL 
RRSAH* PSRPTTTVCHRC 
GDPRTDRAGRPRRCATAA 

A W A ETSRSRRGPESTA AR 
RGPRPR GAAGGPSRP PRG 

-206- 



E G t, G R D V- Q Q A A R A G L H G G 



GAG CGG GTC CGG AGC CAG CTG GAC GAC GCG GCG GGC CCG AGG CTC CAC CGG CGG 
52821 52830 52839 52848 52857 52866 

CTC GCC CAG GCC TCG GTC GAC CTG CTG CGC CGC CCG GGC TCC GAG GTG GCC GCC 

LAQASVDLLRRPGSEVAA 
SPRPRSTCCAARAPRWPP 
RPGLGRPAAPPGLRGGRP 

T SKSSREAS Y*PRSA S S E 
PRSRAA SRRTS. RGARRAR 
QDVELQAGGLVVAQEGLE 

GAC CAG CTG AAG CTC GAC GCG AGG CGG CTC ATG ATG CCG GAC GAG CGG CTC GAG 
52875 52884 52893 52902 52911 52920 

CTG GTC GAC TTC GAG CTG CGC TCC GCC GAG TAC TAC GGC CTG CTC GCC GAG CTC 

LVDFELRSAEYYGLLAEL 
WSTSSCAPPSTTACSPSS 
GRLRAALRRVL RPARRAL 

PRAGSGAAASPNRGSSTA 
PGRGRGRPPRPTGAPRPP 
RAAGGVGRRGLPEQRVLH 

AGC CCG GCG CGG GGG CTG GGG CGC CGC CGG CTC CCC AAG GAC GGC CTG CTC CAC 
52929 52938 52947 52956 52965 52974 

TCG GGC CGC GCC CCC GAC CCC GCG GCG GCC GAG GGG TTC CTG CCG GAC GAG GTG 

SGRAPDPAAAEGFLPDEV 
RAAPPTPRRPRGSCRTRW 
GPRPRPRGGRGVPAGRGG 

SRTLVWASSSVCRRTE SR 
RAP * SGPARRCAGGPRVA 
GLPDPGLREVVRVAPD * Q 

CGG CTC GCC CAG TCC TGG GTC CGC GAG CTG CTG TGC GTG GCG GCC CAG AGT GAC 
52983 52992 53001 53010 53019 53028 

GCC GAG CGG GTC AGG ACC CAG GCG CTC GAC GAC ACG CAC CGC CGG GTC TCA CTG 

AERVRTQALDDTHRRVSL 
PSGSGPRRSTTRTAGSHC 
RAGQDPGARRHAPPGLTA 

P *WAKPV. RKARAWRRV I R 
RSGPRRCGSRGRGAGSSG 
AAVLGEAGAEGEGLAPRD 

GCG CCG ATG GTC CGG AAG CCG TGG GCG AAG CGG GAG CGG GTC GCG GCC TGC TAG 
53037 53046 53055 53064 53073 53082 

CGC GGC TAC CAG GCC TTC GGC ACC CGC TTC GCC CTC GCC CAG CGC CGG ACG ATC 

RGYQAFGTRFALAQRRT I 
AAXRPSAPASPSPSAGRS 
RLPGLRHPLRPRPAPDDP 
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PSSIPSPLVIWAMAASAC 
RRRSPARCSSGPWRRVRA 
EAVLHPEALRDL GDGCER 

GAG CCG CTG CTC TAC CCC GAG CCG TTC TGC TAG GTC CGG TAG CGG CGT GAG CGC 
53091 53100 53109 53118 53127 53136 

CTC GGC GAC GAG ATG GGG CTC GGC AAG ACG ATC CAG GCC ATC GCC GCA CTC GCG 

LGDEMGLGKTIQAIAALA 
SATRWGSARRSRPSPHSR 
RRRDGARQDDPGHRRTRA 

RAASPCLWKMTTQGALTS 
GLRRPASGS*PPRDPWRA 
V*GGLPLAVEHHDTRGAH 

GTG GAT CGG CGG CTC CCC GTC TCG GTG AAG TAC CAC CAG ACA GGC CGG TCG CAC 
53145 53154 53163 53172 53181 53190 

CAC CTA GCC GCC GAG GGG CAG AGC CAC TTC ATG GTG GTC TGT CCG GCC AGC GTG 

HLAAEGQSHFMVVCP ASV 
T*PPRGRATSWWSVRPAC 
PSRRGAEPLHGGL S G QRA 

ILQVRSVSFRLT SRTVGS 
S*SSGPSRSACHAARSVA 
QDVPGPLGLLATHQAHCR 

GAC TAG TTG ACC TGG GCC CTC TGG CTC TTC GCG TCA CAC GAC GCG CAC TGT GGC 
53199 53208 53217 53226 53235 53244 

CTG ATC AAC TGG ACC CGG GAG ACC GAG AAG CGC AGT GTG CTG CGC GTG ACA CCG 

LINWTRETEKRS VLRVTP 
*STGPGRPRSAVCCA*HR 
DQLDPGD REAQCAARDTA 

CPGS RCSANASQFPRPPT 
ARGRGAPRTRRS SPAPRR 

QVAGVPLVREGVPLPPAA 

GAC GTG CCG GGG CTG GCC GTC CTG CGC AAG CGG CTG ACC TTC CCC GCC CCG CCG 
53253 53262 53271 53280 53289 53298 

CTG CAC GGC CCC GAC CGG CAG GAC GCG TTC GCC GAC TGG AAG GGG CGG GGC GGC 

LHGPDRQDAFADWKGRGG 
CTAPTGRTRSPTGRGGAA 
ARPRPAGRVRRLEGAGRR 

ATVVKSASRPKGAGPPPS 
RP*WRRRAAPSGPARPRR 

DRDGGEVRQPAERRGPAA 

CAG CGC CAG TGG TGG AAG CTG CGC GAC GCC CCG AAG GGC CGC GGG CCC CCG CCG 
53307 53316 53325 53334 53343 53352 

GTC GCG GTC ACC ACC TTC GAC GCG CTG CGG GGC TTC CCG GCG CCC GGG GGC GGC 
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SRSPPSTRCGASRRPQAA 
RGHHLRRAAGLPGARGRR 

TPMSTTSS A W * T F F GRVR 
PPCARRPRPGSRS SDGSG 
LHAHEDHVLGVVHL I GPG 

CTC CAC CCG TAC GAG CAG CAC CTG CTC CGG GTG ATG CAC TTC TTA GGG GCC TGG 
53361 53370 53379 53388 53397 53406 

GAG GTG GGC ATG CTC GTC GTG GAC GAG GCC CAC TAC GTG AAG AAT CCC CGG ACC 

EVGMLVVDEAHY VKNPRT 
RWACSSWTRPTT*RIPGP 
GGHARRGRGPLREE SPDP 

REMATE SHASCQ SRTSNR 
GSWPRRRTPPASRGRATG 
AAGHGDGLPRLVAVAHQE 

GCG GCG AGG TAC CGG CAG AGG CTC ACC CGC CTC GTG ACG CTG GCG CAC GAC AAG 
53415 53424 53433 53442 53451 53460 

CGC CGC TCC ATG GCC GTC TCC GAG TGG GCG GAG CAC TGC GAC CGC GTG CTG TTC 

RRSMAVSEWAEHCDRVLF 
AAPWPSPSGRSTATACCS 
PLHGRLRVGGALRPRAVP 

VPVGMS FRTSSNRLRTRI 
SRYAWPSGRRPTGCGPAS 
QGTRGHLVADLLEAAQHP 

GAC TGG CCA TGC GGG TAC CTC TTG GCG CAG CTC CTC AAG GCG TCG GAC CAC GCC 
53469 53478 53487 53496 53505 53514 

CTG ACC GGT ACG CCC ATG GAG AAC CGC GTC GAG GAG TTC CGC AGC CTG GTG CGG 

LTGTPMENRVEEFR S LVR 
*PVRPWRTASRSSAAWCG 
DRYAHGEPRRGVPQ-PGAD 

RWGS SASAMSSCSPTAPE 
GGARAPPPWRRARRRPPS 
DELGLQRLGDVLVVAHRA 

TAG GAG GTC GGG CTC GAC CGC CTC CGG TAG CTG CTC GTG CTG CCG CAC CGC CCG 
53523 53532 53541 53550 53559 53568 

ATC CTC CAG CCC GAG CTG GCG GAG GCC ATC GAC GAG CAC GAC GGC GTG GCG GGC 

ILQPELAEAIDEHDGVAG 
SSSPSWRRPSTSTTAWRA 
PPAR AG GGHRRAR R R G GL 

LANRLATAGT*RRRLWCS 
WPTGCPPRVPRDAGCGAP 
GLREALRDCRDIQAAVLL 



AGG TTC CGC AAG GCG TTC CGC CAG CGT GGC CAG ATA GAC GCG GCG TTG GTC GTC 
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53577— 53586 m 536G4' 53613 53622 

TCC AAG GCG TTC CGC AAG GCG GTC GCA CCG GTC TAT CTG CGC CGC AAC CAG CAG 



SKAFRKAVAPVYLRRNQQ 
PRRSARRSHRSICAATSR 
QGVPQGGRTGLSAPQPAG 

TRVSSGASWCVSSHSSGL 
RG*RVGPAGACPRTPPAW 
VDEGFERRELVRVLPLLG 

CTG CAG GAG TGG CTT GAG GGC CGC GAG GTC GTG TGC CTG CTC ACC CTC CTC GGG 
53631 53640 53649 53658 53667 53676 

GAC GTC CTC ACC GAA CTC CCG GCG CTC CAG CAC ACG GAC GAG TGG GAG GAG CCC 

DVLTELPALQHTDEWEEP 
TSSPNSRRSSTRTSGRS P 
RP HRTPGAPAHGRVGGAQ 

VASSSA*RSATRAPLKMA 
CPPRPPRGRPRARRCS*P 
ARRVLLGVALGHAGAVEH 

TCG TGC CGC CTG CTC CTC CGG ATG GCG CTC CGG CAC GCG CGG CCG TTG AAG TAC 
53685 53694 53703 53712 53721 53730 

AGC ACG GCG GAC GAG GAG GCC TAC CGC GAG GCC GTG CGC GCC GGC AAC TTC ATG 

STADEEAYREAVRAGNFM 
ARRTRRPTARPCAPATSW 
HGGRGGLPRGRARRQLHG 

IRLAAYARGSRDAFTCRS 
SACPPTRADPATRSPAGA 
RHAPRRVRTRLPGRLHVP 

CGC TAC GCG TCC CGC CGC ATG CGC GCA GGC CTC GCC AGG CGC TTC CAC GTG GCC 
53739 53748 53757 53766 53775 53784 

GCG ATG CGC AGG GCG GCG TAC GCG CGT CCG GAG CGG TCC GCG AAG GTG CAC CGG 

AMRRAAYARPERSAKVHR 
RCAGRRTRVRSGPRR CT G 
DAQ G GVRASGAVRE GAP A 

RSIASSAASFPSFTTTNE 
ARSRQPPRRSRASPRPTR 
QALD SLLGGLVPQLDHHE 
■* — 

GAC GCG CTC TAG CGA CTC CTC CGG CGG CTC TTG CCC GAC TTC CAG CAC CAC AAG 
53793 53802 53811 53820 53829 53838 

CTG CGC GAG ATC GCT GAG GAG GCC GCC GAG AAC GGG CTG AAG GTC GTG GTG TTC 

LREIAEEAAENGLKVVVF 
CARSLRRPPRTG*RSWCS 
ARDR*GGRRERAEGRGVL 

A N ,,JR STSATTRSASVSAAP 
RTGPRVPLPVRPA*PRPR 
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AGG CGC AAG GCC CTG CAT GAC CGT CAC CAT GCG CTC CGC GAG TGC CTG CGC CGG 
53847 53856 53865 53874 53883 53892 

TCC GCG TTC CGG GAC GTA CTG GCA GTG GTA CGC GAG GCG CTC ACG GAC GCG GCC 

SAFRDVLAVVREALTDAA 
PRSGTYWQWYARRSRTRP 
RVPGRTGSGTRGAHGRGR 

GPASAPGCSSGPDSSPRA 
ALPPLLGAPRAPT RLPAL 
PWPRFCARLVLRPGFLP S 

CCC GGT CCC CGC CTT CGT CCG GGC GTC CTG CTC GGC CCC AGG CTT CTC CCC GCT 
53901 53910 53919 53928 53937 53946 

GGG CCA GGG GCG GAA GCA GGC CCG CAG GAC GAG CCG GGG TCC GAA GAG GGG CGA 

GPGAEAGPQDEPGSEEGR 
GQGRKQARRTSRGPKRGE 
ARGGSRPAGRAGVRRGAS 

VASARP GAT S LA A VG S VG 
WLPHAPGPPPFPLWAPCA 
GCRIRPARRHFPCGRRVR 

CGG TGT CGC CTA CGC GCC CCG GGC CGC CAC CTT TCC CGT CGG TGC GGC CTG TGC 
53955 53964 53973 53982 53991 54000 

GCC ACA GCG GAT GCG CGG GGC CCG GCG GTG GAA AGG GCA GCC ACG CCG GAC ACG 

ATADARG PAVERAATPD T 
PQRMRGARRWKGQPRRTR 
HSGCAGPGGGKGSHAGHA 

PWSS IAATRSVGAGVSRV 
P GPP S RRRVPCVPA S P A S 
RALLLDGGYPVCRRRRLP 

GGC CCG GTC CTC CTC TAG CGG CGG CAT GCC CTG TGT GGC CGC GGC TGC CTC GCC 
54009 54018 54027 54036 54045 54054 

CCG GGC CAG GAG GAG ATC GCC GCC GTA CGG GAC ACA CCG GCG CCG ACG GAG CGG 

PGQEE IAAVRDTPAPTER 
RARRR S P PYG T HRRR R S G 
GPGGDRRRTGHTGADGAD 

PGRLTGPGRAPRTNPGI E 
PAACPAPVAPRAHTRA S R 
RPRAPHRSRPGPTHEPRD 

TGC CCC GGC GCG TCC CAC GGC CCT GGC GCC CGG CCC GCA CAC AAG CCC GGC TAG 
54063 54072 54081 54090 54099 54108 

ACG GGG CCG CGC AGG GTG CCG GGA CCG CGG GCC GGG CGT GTG TTC GGG CCG ATC 

TGPRRVPGPRAGRVFGP I 
RGJ^AGCRDRGPGVCSGRS 
GAAQGAGTAGRACVRADL 

-211 - 



PLTGGARRCCSTSSKAAA 
PCRAARGGVAARRRSRRR 
RAAHR G GA S LL E D V V E G G 

AGC CCG TCG CAC GGC GGG CGG GCG GCT GTC GTC GAG CAG CTG CTG AAG CGG CGG 
54117 54126 54135 54144 54153 54162 

TCG GGC AGC GTG CCG CCC GCC CGC CGA CAG CAG CTC GTC GAC GAC TTC GCC GCC 

SGSVPPARRQQLVDDFAA 
RAACRPPADSSSSTTSPP 
GQRAARPPTAARRRLRRR 

GP*ATSSACISAPPTPRL 
ARDRRVARASRPLRLPG* 
RGTVGYQERLDLCASHAE 

CGC GGG CCA GTG CGG CAT GAC GAG CGC GTC TAG CTC CGT CCG CCT CAC CCG GAG 
54171 54180 54189 54198 54207 54216 

GCG CCC GGT CAC GCC GTA CTG CTC GCG CAG ATC GAG GCA GGC GGA GTG GGC CTC 

APGHAVLLAQIEAGGVGL 
RPVTPYCSRRSRQAEWAS 
ARSRRTARADRGRRSGPQ 

MCAAETT IRQSGCSLGVT 
CAPRRRP SGRRAAA*AS R 
VHLGGGHHDEALRLELRG 

TTG TAC GTC CGG CGG AGG CAC CAC TAG GAG ACG CTC GGC GTC GAG TTC GGC TGG 
54225 54234 54243 54252 54261 54270 

AAC ATG CAG GCC GCC TCC GTG GTG ATC CTC TGC GAG CCG CAG CTC AAG CCG ACC 

NMQAASVVILCEPQLKPT 
TCRPPPW*SSASRSSSRP 
HAGRLRGDPLRAAAQADR 

SCWATARAWRMPWTRE TR 
RVGPPR GHGGCPGPGSPG 
DFVLRDGT GVAHALDARD 

CAG CTT GTG GTC CGC CAG CGG GCA CGG GTG GCG TAC CCG GTC CAG GCG AGC CAG 
54279 54288 54297 54306 54315 54324 

GTC GAA CAC CAG GCG GTC GCC CGT GCC CAC CGC ATG GGC CAG GTC CGC TCG GTC 

VEH QAVARAHRMGQVRSV 
SNTRR S PVPTAWARSAR S 
RTPGGRPCPPHGPGPLG-P 

TCRRSQVSPTSSRRTRI S 
RAGGARCPLPPRVGPASA 
AHVAQEARFPHVFAQHPH 

GCG CAC GTG GCG GAC GAG ACG TGC CTT CCC CAC CTG CTT GCG GAC CAC GCC TAC 
54333 54342 54351 54360 54369 54378 

CGC GTG CAC CGC CTG CTC TGC ACG GAA GGG GTG GAC GAA CGC CTG GTG CGG ATG 
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a R" ' ' L" E C T E- G V D E' R D V R M 

ACTACSARKGWTNAwcGC 
RAPPALHGRGGRTPGADA 

SFLD RRNSA*ARR LATAC . 
PSCT GGTRRKRGGCR PRR 
QLVLGAQEVSVGAAARdg 

GAC CTC TTG TTC AGG GCG GAC AAG CTG CGA ATG CGG GCG GCG TCG CGC CAC err 
54387 54396 54405 54414 54423 5443^ 

CTG GAG AAC AAG TCC CGC CTG TTC GAC GCT TAC GCC CGC CGC AGC GCG GTC GCC 

L E N K S R L F D A Y A R R S A "v _ a" 

WRTSPACSTLTPAAARSP 
GEQVPPVRRLRP PQRGRR 

DVGSAT SMESRARARWMT 
TSV ^RRRCR PGRGPGGCR 
_ L _ R _ C _ _ R V G D V D R V E G Q G A V D 

CTC AGC TGT GGC CTG CGG CAG CTG TAG AGC CTG GAG CGG GAC CGG GCG GTG He 
54441 54450 54459 54468 54477 54486 

GAG TCG ACA CCG GAC GCC GTC GAC ATC TCG GAC CTC GCC CTG GCC CGC CAC ATC 

E S T P D A V D I S D L A L A _ "r" H _ T 
SRHRTPSTSRTSPWP ATS 

vdtgrrrhlgprp GPPHr 

SSSCARNPAHTGTAAGIR 
PPPVp VTPPTLEP RRA * E 

-^__L_ LFLCPQPRSNRDGRR N 

CAC CTC CTC CTT GTC CGT GCC AAC CCC CGC ACT CAA GGC CAG CGG CGC GGA T^AA 
54495 54504 54513 54522 54531 54540 

GTG GAG GAG GAA CAG GCA CGG TTG GGG GCG TGA GTT CCG GTC GCC GCG CCT ATT 

V E E E Q A R L G A * VP V A A _ ~p~ ~t~ 
WRRNRHGWGREFRSPRL F 
GGGTGTVGGVS SGRRAY S 

HHRLHLGALRHPQQPPHP 
TTASTFARWATPSVQLTP 
_ P P Pp PSPGGPPPASRS Pp 

GCC ACC ACC GCC TCC ACT TCC GGG CGG TCC GCC ACC CCG ACT GGA CCT CCC ACC 
54549 54558 54567 54576 54585 54594 

CGG TGG TGG CGG AGG TGA AGG CCC GCC AGG CGG TGG GGC TGA CCT GGA GGG TGG 

R W W R R * R P A R R W G * P ~g~ G~ ~w" 

GGGGGEGPPGGGADLEGG 
VVAEVKARQAVGL TWRVG 

RRGPHEQLRPHPHHPPLP 
GDEPTNKSDRIHITHPCL 
ATKRPTRPTASTSPTPAS 

CCG GCA GAA GGC CCC ACA AGA ACC TCA GCG CCT ACA CCT ACC ACA CCC CCG TCT 
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54603 * 5461 2- 5462V 54630 54639 54648 

GGC CGT CTT CCG GGG TGT TCT TGG AGT CGC GGA TGT GGA TGG TGT GGG GGC AGA 



G RL P G C .S W S.R G C GW C G G R 

AVFRGVLGVADVDGVGAE 
PSSGVFLESRMWMVWGQR 

CGRRVPRGRQRQLEVQVV 
AVEVCQGGESGSYSS KFW 
PLRSASAARAAATARS SG 

CCC GTT GGA GCT GCG TGA CCG GCG GGA GCG ACG GCG ACA TCG AGC TGA ACT TGG 
54657 54666 54675 54684 54693 54702 

GGG CAA CCT CGA CGC ACT GGC CGC CCT CGC TGC CGC TGT AGC TCG ACT TGA ACC 

GQPRRT GRPRCRC S S T * T 
GNLDALAALAAAVARL EP 
ATSTHWPPSLPL*LDLNH 

*TRHENIEWWVT*CA RRS 
ELATSM*RGGSPRAPE EV 
SLHPA*KDGVLRDLLSKS 

TGA GTT CAC GCC ACG AGT AAA TAG AGG GTG GTC TGC CAG ATC GTC CGA GAA GCT 
54711 54720 54729 54738 54747 54756 

ACT CAA GTG CGG TGC TCA TTT ATC TCC CAC CAG ACG GTC TAG CAG GCT CTT CGA 

TQVRCSFISHQTV*Q A L R 
LKCGAHLSPTRRSSRLFD 
SSAVLIYLPPDGLAGSST 

RRL*PRHGCCRMSARWSP 
GASDHGTVAADC VQAGPH 
EQPTMAQSRLMAYK RAL I 

GAG GAC GCC TCA GTA CCG GAC ACT GGC GTC GTA GCG TAT GAA CGC GCG GTC CTA 
54765 54774 54783 54792 54801 54810 

CTC CTG CGG AGT CAT GGC CTG TGA CCG CAG CAT CGC ATA CTT GCG CGC CAG GAT 

LLRSHGL*PQHRILARQD 
SCGVMACDRSIAYLRARM 
PAESWPVTAASHTCAPGW 

CRTRALFGSAAVNARP TP 
VGRGPWFGVPQWTPERHL 
SVEDPGSVWQSGRQSETY 

CCT GTG GAG CAG GCC CGG TCT TTG GGT GAC CGA CGG TGC AAC CGA GAG CCA CAT 
54819 54828 54837 54846 54855 54864 

GGA CAC CTC GTC CGG GCC AGA AAC CCA CTG GCT GCC ACG TTG GCT CTC GGT GTA 

GHLVRARNPLAATLAL GV 
DTSSGPETHWLPRWLSV* 
TPRPGQKPTGCHVGSRCR 

WT..ST I PRRWSPSPATWDP 
GPAPSRADGPPHLPRGTR 
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CCG GTC CAC GAC CAC TAG CCC GCA GAG GTC CTC CCA CTT CCC CGG CAG GTC AGG 
54873 54882 54891 54900 54909 54918 

GGC CAG GTG CTG GTG ATC GGG CGT CTC CAG GAG GGT GAA GGG GCC GTC CAG TCC 

GQVLVI GRLQEGE GAVQ S 
ARCW* S GVSRRVK GP S S P 
PGAGDRASPGG*RGRPVR 

THPPACPYFSSPSGRSNP 
RTRLHAHTSVP. PRA6PTR 
AHASTRMPLFQLALGPLE 

CCG CAC ACG CCT CCA CGC GTA CCC ATC TTT GAC CTC CCG CTC GGG GCC CTC AAG 
54927 54936 54945 54954 54963 54972 

GGC GTG TGC GGA GGT GCG CAT GGG TAG AAA CTG GAG GGC GAG CCC CGG GAG TTC 

GVCGGAHG*KLEGEPRE F 
ACAEVRMGRNWRASPGS S 
RVRRCAWVETGGRAP GVR 

ASAYTASSTATSKRGGSN 
RVRTPPPAPRPP S EAGRT 

ACERLHRLQDRHVKPGGL 

CCG CGT GAG CGC ATC CAC CGC CTC GAC CAG CGC CAC CTG AAA GCC GGG GGG CTC 
54981 54990 54999 55008 55017 55026 

GGC GCA CTC GCG TAG GTG GCG GAG CTG GTC GCG GTG GAC TTT CGG CCC CCC GAG 

GALA*VAELVAVDFRPPE 
AHSRRWRSWSRWTFGPPS 
RTRVGGGAGRGGL SAPRV 

STCCRSGCSSA**RRASA 
RHVAGAGVRHLEDDAPVQ 
EIYLVPEWVIFSMMPPCK 

AAG CTA CAT GTC GTG GCC GAG GGT GTG CTA CTT CGA GTA GTA GCC GCC CGT GAA 
55035 55044 55053 55062 55071 55080 

TTC GAT GTA CAG CAC CGG CTC CCA CAC GAT GAA GCT CAT CAT CGG CGG GCA CTT 

FDVQHRLPHDEAHHRRAL 
SMYSTGSHTMKL I IGGHL 

RCTAPAPTR*SSSSAGTC 

TCSRRANSAVRRRPKWS T 
PAPDGPTRHSGGDQS GAR 
RHLIEQREIRGETK AELE 

CGC CAC GTC CTA GAG GAC CGC AAG CTA CGC TGG GAG GCA GAA CCG AAG GTC GAG 
55089 55098 55107 55116 55125 55134 

GCG GTG CAG GAT CTC CTG GCG TTC GAT GCG ACC CTC CGT CTT GGC TTC CAG CTC 

AVQDLLAFDATLRLGFQL 
RC R.I5WRSMRPSVLASSS 
GAGSPGVRCDPPSWLPAR 
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RTTRRYASACSRAPT tap 
GRRVATRARAPGRPRLRP 
DEDYPPVRERLVARAYDR 

CAG GAG CAG CAT GCC GCC ATG CGC GAG CGC GTC CTG GCG CGC CCG CAT CAG CGC 
55143 55152 55161 55170 55179 55188 

GTC CTC GTC GTA CGG CGG TAC GCG CTC GCG CAG GAC CGC GCG GGC GTA GTC GCG 

VLVVRRYALAQDRAGVVA 
S'SSYGGTRSRRTARA* SR 
PRRTAVRARAGPRGR SRG 

RSCAP* CSPTTTGACPSPR 
DPAPRAPRRQRVLVPLHG 
TQLLGPLVANDYWCLS IA 

CCA GAC CTC GTC CGG CCC GTC CTG CCG CAA CAG CAT GGT CGT GTC CCT CTA CCG 
55197 55206 55215 55224 55233 55242 

GGT CTG GAG CAG GCC GGG CAG GAC GGC GTT GTC GTA CCA GCA CAG GGA GAT GGC 

GLEQAGQDGVVVPAQGDG 
VWSRPGRTALSYQ HREMA 
S GAGRAGRRCRT S T GRWP 

GSTCWTSSRSCRSSTSRR 
GARAGHVAGRVAPVPRD G 
EREHVMYQ EAFLP FQD I E 

GAG GfGC GAG CAC GTG GTA CAT GAC GAG GCG CTT GTC GCC CTT GAC CAG CTA GAG 
55251 55260 55269 55278 55287 55296 

CTC CCG CTC GTG CAC CAT GTA CTG CTC CGC GAA CAG CGG GAA CTG GTC GAT CTC 

LPLVHHVLLREQRELVDL 
SRSCTMYCSANSGNWSI S 
P A R A P C T A P R T A G T G R S P 

CTRSGPLWRARRTSSNTW 
AHERGRCGVHGEHRPTRG 
PMNEVGAALTGKTDLLED 

GCC GTA CAA GAG CTG GGG CCG TCG GTT GCA CGG GAA GCA CAG CTC CTC AAG CAG 
55305 55314 55323 55332 55341 55350 

CGG CAT GTT CTC GAC CCC GGC AGC CAA CGT GCC CTT CGT GTC GAG GAG TTC GTC 

RHVLDPGSQRALRVEEFV 
GMFSTPAA NVPFVSRSSS 
ACSRPRQPTCPSCRGVRP 

RRPSNSCCPGGGRNSRRS 
AGPRTRAAPAAEGTRDVR 
LAQALELLLPRRGQE I SA 



GTC GCG GAC CCG CTC AAG CTC GTC GTC 
55359 55368 55377 

CAG CGC CTG GGC GAG TTC GAG CAG CAG 



CCC GGC GGA GGG GAC AAG CTA GCT GCG 
55386 55395 55404 

GGG CCG CCT CCC CTG TTC GAT CGA CGC 
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Q R> Ei G K F E Q Q G * P l P * F t F D R R 
SAWASSSSRGRLPCSIDA 
APGRVRAAGAASPVRSTR 

PRRTPSSRKAWPVRRSAR 
HDGRRRPGSQGPFEAHLG 
ITEEDALVAKGLSSQTFG 

CTA CCA GAG GAG CAG CCG CTC CTG GCG AAA CGG GTC CCT TGA GAC GCA CTT CGG 
55413 55422 55431 55440 55449 55458 

GAT GGT CTC CTC GTC GGC GAG GAC CGC TTT GCC CAG GGA ACT CTG CGT GAA GCC 

DGLLVGEDRFAQGTLREA 
MVSSSARTALPRELCVKP 
WSPR RRGPLCPGNSA* SP 

RRAPPRCRSAWWGCPRCT 
GGQPRGADAQGGDAHDVP 
AAKRAAQMQKGVMRM T S L 

GCG GCG GAA CGC CCG CCG GAC GTA GAC GAA CGG GTG GTA GGC GTA CCA GCT GTC 
55467 55476 55485 55494 55503 55512 

CGC CGC CTT GCG GGC GGC CTG CAT CTG CTT GCC CAC CAT CCG CAT GGT CGA CAG 

RRLAGGLHLLAHHPHGRQ 
AALRAAC ICLPT IRMVDR 
PPCGRPAS ACPPSAWSTG 



RRGRC SRPT*APRVGWVC 
EEEAAAEQLEHQGLEGCA 
NKKRPLKKSN (m) S A * S G V R 



CAA GAA GAA GGC GCC GTC GAA GAA CCT CAA GTA CGA CCG GAT TGA GGG GTG TGC 
55521 55530 55539 55548 55557 55566 

GTT CTT CTT CCG CGG CAG CTT CTT GGA GTT CAT GCT GGC CTA ACT CCC CAC ACG 

VLLPRQLLGVHAGLTPHT 
FFFRGSFLEFMLA*LPTR 
SSSAAASWSSCWPNSPHA 

GYPGPTSGYLIRTRTCAS 
GMLVRHRGTCFGLVPARV 
VWLSGTDVRVFDSYPHVC 

GTG GGT ATT CCT GGG CCA CAG CTG GGC ATG TTT TAG GCT CAT GCC CAC GTG CGT 
55575 55584 55593 55602 55611 55620 

CAC CCA TAA GGA CCC GGT GTC GAC CCG TAC AAA ATC CGA GTA CGG GTG CAC GCA 

HP *GPGVDPYKIRVRVHA 
THKDPVSTRTKSEYGCTH 
P IRTRCRPVQNPSTGART 

I FAL *AARCEDRSRRLRV 
SLLWDRQAVNTGHVVCVF 
QYFGIVSRSMRGTFSAFS 



GAC TAT TTT CGG TTA GTG CGA CGC GCT GTA AGC AGG GCA CTT GCT GCG TTT GCT 
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55.6291. . . 556:3a ; . 55647 55656.V. . 5.5665 55674 

CTG ATA AAA GCC AAT CAC GCT GCG CGA CAT TCG TCC CGT GAA CGA CGC AAA CGA 



LIKANHAARHSSRERRKR 
* * K P I TLRDIRPVNDANE 
DKSQSRCATFVP*TTQTN 

GGGARGTRRVCGGIWGRQ 
EGVLAVLEVCAVASGDGS 
SGWWRSWN*ARLRRDMGA 

TGA GGG GGT GGT CGC GCT GGT CAA GAT GCG TGC GTT GGC GGC TAG GTA GGG GCG 
55683 55692 55701 55710 55719 55728 

ACT CCC CCA CCA GCG CGA CCA GTT CTA CGC ACG CAA CCG CCG ATC CAT CCC CGC 

TPPPARPVL RTQPPI HPR 
LPHQRDQFYARNRRS IPA 
SPT SATSSTHATADPSP L 

GCSSRRTV*TSPGRRSPG 
GA VQGGP*ELVPAEGVPV 
ARLKVEQDSLYQPRESQS 

ACG GGC GTT GAA CTG GAG GAC CAG TGA GTT CAT GAC CCC GGA GAG GCT GAC CCT 
55737 55746 55755 55764 55773 55782 

TGC CCG CAA CTT GAC CTC CTG GTC ACT CAA GTA CTG GGG CCT CTC CGA CTG GGA 

CPQLDLLVTQVLGPLRLG 
ARNLTSWSLKYWGLSDWD 
PAT*PPGHSSTGASPTGT 

PR RRVGRRSRTP SWRGGG 
PGVVYEEAHALQRGVGEE 
RAS ST SRQTLSNAVLARR 

GGC CCG GCT GCT GCA TGA GGA GAC GCA CTC GCT CAA CCG CTG GTT GCG GGA GGA 
55791 55800 55809 55818 55827 55836 

CCG GGC CGA CGA CGT ACT CCT CTG CGT GAG CGA GTT GGC GAC CAA CGC CCT CCT 

PGRRRTPLRERVGDQRPP 
RADDVLLCVSELATNALL 
GPTTYSSA*ASWRPTPSS 

RRGARGHNGEERGSHRRR 
VADR GAMTEKKADA I VAV 
WPTGGPWPKRRRTR* SPS 

GGT GCC GCA GGG CGG GCC GGT ACC AAA GGA AGA AGC GCA GGC GAT ACT GCC GCT 
55845 55854 55863 55872 55881 55890 

CCA CGG CGT CCC GCC CGG CCA TGG TTT CCT TCT TCG CGT CCG CTA TGA CGG CGA 

PRRPARPWFPSSRPL*RR 
HGVPPGHGFLLRVRYDGD 
TASRPAMVSFFASAMTAT 

G G JR RPGRCRFPRVGFGRR 
DE AD LDVVASRAYGS GGV 
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GCA GGA GGC GCA GCT CCA GGT GCT GTC GCC TTG CCC GCA TGG GGC TTG GGG GCT 
55899 55908 55917 55926 55935 55944 

CGT CCT CCG CGT CGA GGT CCA CGA CAG CGG AAC GGG CGT ACC CCG AAC CCC CGA 

RPPRRGPRQRNGRTPNPR 
VLRVEVHDSGTGVPRTPD 
SSASRSTTAERAYPEPPT 

GRRLRGRDAGPRRAPRCT 
VGVFAAATQEQDARQGVL 
SGSSPPRPRSRTPASASL 

GCT GGG GCT GCT TCC GCC GGC GCC AGA CGA GGA CCA GCC GCG CGA CCG GCT GTT 
55953 55962 55971 55980 55989 55998 

CGA CCC CGA CGA AGG CGG CCG CGG TCT GCT CCT GGT CGG CGC GCT GGC CGA CAA 

RPRRRRPRSAPGRRAGRQ 
DPDEGGRGLLLVGALADK 
TPTKAAAVCSWSARWPT S 

PRPRAFARCLRRPRTRRA 
PAHALSRGAFDDPGLEGH 
HPTP SRVGPLTTQASNAT 

CAC CCC GCA CCC GCT CGC TTG CGG GCC GTT TCA GCA GAC CCG GCT CAA GCG GCA 
56007 56016 56025 56034 56043 56052 

<GTG GGG CGT GGG CGA GCG AAC GCC CGG CAA AGT CGT CTG GGC CGA GTT CGC CGT 

VGRGRANARQSRLGRVRR 
WGVG .ERTPGKVVWAEFAV 
GAWASERPAKSSGPSSPC 

PGKHLEQPPRLREASACS 
LART CNRHLG*DKPQRVP 
CPGQAI GTSAEIKRSVCL 

CGT CCC GGG AAC ACG TTA AGG ACA CCT CCG GAG TTA GAA AGC CGA CTG CGT GTC 
56061 56070 56079 56088 56097 56106 

GCA GGG CCC TTG TGC AAT TCC TGT GGA GGC CTC AAT CTT TCG GCT GAC GCA CAG 

AGPLCNSCGGLNLSADAQ 
QGPCAIPVEASI FRLTHR 
RALVQFLWRPQSFG*RTG 

LCLSNVHGQGSRRTAGVL 
SACHT SMGRGVGGRRGWL 
LPVTLQCAGAWEAADGGC 

CTC TCC GTG TCA CTC AAC TGT ACG GGG ACG GGT GAG GCG GCG CAG CGG GGG TGT 
56115 56124 56133 56142 56151 56160 

GAG AGG CAC AGT GAG TTG ACA TGC CCC TGC CCA CTC CGC CGC GTC GCC CCC ACA 

ERHSELTCPCPLRRVAPT 
R G SL V S *HAPAHSAASPPQ 

EAQ*VDMPLPTPPRRPHK 
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A G G I SSSGESPLSADYGi 
RVVSQPPGRLHCHHTMGP 
ACWRNLLVG*IATIR*VR 

TCG CGT GGT GGC TAA CTC CTC CTG GGG AGT CTA CCG TCA CTA CGC AGT ATG GGC 
56169 56178 56187 56196 56205 56214 

AGC GCA CCA CCG ATT GAG GAG GAC CCC TCA GAT GGC AGT GAT GCG TCA TAC CCG 

SAPPIEEDPSDG S^^ D A S Y P 
AHHRLRRTPQMA (v) M R H T R 
RTTD*GGPLRWQ*CVIP< 

=> 

FVPRG*RSPWRPGRRSG1 
SSQGGEAHRGGRGEGRAE 
RLSAARLTVA VAARAALR 

CGC TTC TGA CCG GCG GGA GTC GCA CTG CCG GTG GCG CCG GGA GCG GCG CTC GGA 
56223 56232 56241 56250 56259 56268 

GCG AAG ACT GGC CGC CCT CAG CGT GAC GGC CAC CGC GGC CCT CGC CGC GAG CCT 

AKTGRPQRDGHRGPRREP 
RRLAAL SVTATAALAAS L 
EDWPPSA*RPPRPSPR AJ! 

RREGRWPRGRPGYGTRPI 
DGSEGGRGGGLATDLVRA 
T EARGA. VAAGSPR IWYAP 

GCA GAG GCG AGA GGG GCG GTG CCG GCG GGG GCT CCC GGC ATA GGT CAT GCG CCC 
56277 56286 56295 56304 56313 56322 

CGT CTC CGC TCT CCC CGC CAC GGC CGC CCC CGA GGG CCG TAT CCA GTA CGC GGG 

RLRSPRHGRPRGPYPVRG 
VSALPATAAPEGRIQ YAG 
SPLSPPRPPPRAVSSTRi 

P L R R P R C S C R S G * P P G R ( 
RCVGHGVAVDHVE LRVVG 
AASATASL*MTFRLASWA 

GCG CCG TCT GCG GCA CCG GCT GTC GAT GTA GCA CTT GGA GTT CCG CCT GGT GCG 
56331 56340 56349 56358 56367 56376 

CGC GGC AGA CGC CGT GGC CGA CAG CTA CAT CGT GAA CCT CAA GGC GGA CCA CGC 

RGRRRGRQLHREPQGGPR 
AADAVADSYIVNLKADHA 
RQTPWPTATS*TSRRTTI 

NPNRPRVRGRRSTRRRCI 
TRTGLGSAGEDLLVAGVD 
REPESAPRART. SFYPASM 



GGC AAG CCC AAG GCT CCG GCC TGC GCG 
56385 56394 56403 

CCG TTC GG.fi TTC CGA GGC CGG ACG CGC 



GGA GCA GCT CTT CAT GCC GCG GCT GTA 
56412 56421 56430 

CCT CGT CGA GAA GTA CGG CGC CGA CAT 
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P F- G F R G R T R P R R E V* r R R H 
RSGSEAGRALVEKYGAD I 
VRVPRPDAPSSRSTAPT 

ACTCSPGSRSRSRPRRpp 
LARVLLGQVAVRDLGGLR 
SRVYLFARFP*AISAESA 

GCT CGC GTG CAT GTT CTT CCG GGA CTT GCC GAT GCG CTA GCT CCG GAG GCT CCG 
56439 56448 56457 56466 56475 56484 

CGA GCG CAC GTA CAA GAA GGC CCT GAA CGG CTA CGC GAT CGA GGC CTC CGA GGC 

RAHVQEGPERLRDRGLRG 
ERTYKKALNGYAI EASEA 
SARTRRP*TATRSRPPRR 

PWPARRRGPPRRRPGSGC 
LGLREGGVRRDGGHD L V A 
SALASAASGATAETTWFR 

CCT CCG GTT CCG CGA GCG GCG GCT GGG CCG CCA GCG GAG GCA CCA GGT CTT GGC 
56493 56502 56511 56520 56529 56538 

GGA GGC CAA GGC GCT CGC CGC CGA CCC GGC GGT CGC CTC CGT GGT CCA GAA CCG 

GGQGARRRPGGRLRGPEP 
EAKALAADPAVASVVQNR 
RPRRSPPTRRSPP WSRTA 

T * CRR S GSWGARRP GP GR 
HEADVRGLGVRGGPAQVA 
MNLMSAVWVLGGE QPRSR 

GTA CAA GTC GTA GCT GCG CTG GGT CTG GTT GGG CGG GAG GAC CCC GGA CCT GGC 
56547 56556 56565 56574 56583 56592 

CAT GTT CAG CAT CGA CGC GAC CCA GAC CAA CCC GCC CTC CTG GGG CCT GGA CCG 

HVQHRRDPDQPALLGPGP 
MFS IDATQTNPPSWGLDR 
CSAS TRPRPTRPPGAWTA 

PGSSGGGSCSTCRGPSPR 
HVLLVE GQVARVGVRVRG 
TSWFFRGRFLEYV*GSEA 

GCA CCT GGT CTT CTT GGA GGG GGA CTT GTC GAG CAT GTG GAT GGG CCT GAG CCG 
56601 56610 56619 56628 56637 56646 

CGT GGA CCA GAA GAA CCT CCC CCT GAA CAG CTC GTA CAC CTA CCC GGA CTC GGC 

RGPEEPPPEQLVHLPGLG 
VDQKNLPLNSSYTYPDSA 
WTRRTSP*TARTPTRTRP 

APLS PTR*RCRRGC* GCR 
PLSHRRVDDVGADAD GVA 
PCPTVAYTMSVPTRMVWL 



GCC CGT CCC TCA CTG CCG CAT GCA GTA GCT GTG GCC GCA GGC GTA GTG GGT GTC 
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56655 56664 : 56673 56682* 5669T 56700 

CGG GCA GGG AGT GAC GGC GTA CGT CAT CGA CAC CGG CGT CCG CAT CAC CCA CAG 



RAGSDGVRHRHRRPHHPQ 
GQGVTAYVIDTGVRI THS 
GRE * R R T S STPASA SPT i 

SRRGPRRRSRRWRCRCCI 
VEAAPGGVAVVGDVVVVG 
SKPPRAE*P*SAMSL SLV 

GCT GAA GCC GCC GGC CCG GAG GAT GCC GAT GCT GCG GTA GCT GTT GCT GTT GTG 
56709 56718 56727 56736 56745 56754 

CGA CTT CGG CGG CCG GGC CTC CTA CGG CTA CGA CGC CAT CGA CAA CGA CAA CAC 

RLRRPGLLRLRRHRQRQH 
DFGGRASYGYDAI DNDNT 
TSAAGPPTATTPSTTTT] 

GPRGRGRCARPRCPRRC] 
GLVAVAVARVHGARD GAV 
AWSPWPWPVCTAPVTAPL 

GCG GGT CCT GCC GGT GCC GGT GCC GTG CGT GCA CCG GCC GTG CCA GCG GCC GTT 
56763 56772 56781 56790 56799, 56808 

CGC CCA GGA CGG CCA CGG CCA CGG CAC GCA CGT GGC CGG CAC GGT CGC CGG CAA 

RPGRPRPRHARGRHGRRQ 

AQDGHGHGTHVAGT.VAGN 
PRTATATARTWPAR SPA' 

RRRRWSPWSRLRGRAS C i 
GVADGLLGLDYADAHQVV 
A*PTALFALITPTRT SFL 

GCG GAT GCC GCA GCG GTT CTT CCG GTT CTA GCA TCC GCA GGC GCA CGA CTT GTT 
56817 56826 56835 56844 56853 56862 

CGC CTA CGG CGT CGC CAA GAA GGC CAA GAT CGT AGG CGT CCG CGT GCT GAA CAA 

RLRRRQEGQDRRRPRAEQ 
AYGVAKKAKIVGVRVLNN 
PTASPRRPRS*ASAC*T r 

RGPCWRGPRRRCRS PRGJ 
GALAGGGLDDGADVPDGP 
EPWPVVAWTTAPMSQTAR 

GAG GCC GGT CCC GTG GTG GCG GGT CCA GCA GCG GCC GTA GCT GAC CCA GCG GGC 
56871 56880 56889 56898 56907 56916 

CTC CGG CCA GGG CAC CAC CGC CCA GGT CGT CGC CGG CAT CGA CTG GGT CGC CCG 

LRPGHHRPGRRRHRLGRP 
SGQGTTAQVVAGI DWVAR 
PARAPPPRSSPASTGSPC 

RR *APRRWCTGRRRRRCI 
VGDLRGDGVHGEAAAGVR 
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CTT GCG GCA GTT CGG CCG GCA GCG GTT 
56925 56934 56943 

GAA CGC CGT CAA GCC GGC CGT CGC CAA 



GTA CAG GGA GCC GCC GCC GCG GCT GTG 
56952 56961 56970 

CAT GTC CCT CGG CGG CGG CGC CGA CAC 




CCG GGA GCT GTG CCG GCA TGC GTT GCG GTA CCG GAG GCC GCA GTG GAA GCG GCA 
56979 56988 56997 57006 57015 57024 

GGC CCT CGA CAC GGC CGT ACG CAA CGC CAT GGC CTC CGG CGT CAC CTT CGC CGT 

GPRHGRTQRHGLRRHLRR 
ALDTAVRNAMASGVT FAV 
PSTRPYATPWPPASPSPW 

PRCRTSWRRWSTVRVR*R 
RGAVLRGVGGRP* GCADG 
AAPL SDVLAEVLDGARTV 

CCG CCG GCC GTT GCT CAG CTG GTT GCG GAG GTG CTC CAG TGG GCG TGC GCA GTG 
57033 57042 57051 57060 57069 57078 

GGC GGC CGG CAA CGA GTC GAC CAA CGC CTC CAC GAG GTC ACC CGC ACG CGT CAC 

GGR QRVD QRLHEV TR T R H 
AAGNESTNASTRSPARVT 
RPAT SRPTPPRGHPHAS P 

PW*PRRSSWSPRWPRSSW 
LGDRDARRGARVGL GAVG 
SAMVTPAVVLESALAP * E 

GCT CCG GTA GTG CCA GCC GCG CTG CTG GTC GAG CCT GCG GTT CCG GCC GAT GAG 
57087 57096 57105 57114 57123 57132 

CGA GGC CAT CAC GGT CGG CGC GAC GAC CAG CTC GGA CGC CAA GGC CGG CTA CTC 

RGHHGRRDDQLGRQGRLL 
E A I TVGATTSSDAKAGYS 
RPSR SARRPARTPRPATP 

SRSRGRGRRGRNTW * RPR 
VVAGDEVEEGGTRGD GRG 
L*PETRSRKAGPEDMVEA 



GTT GAT GCC GAG GCA GGA GCT GGA GAA GCG GGG GCC AAG CAG GTA GTG GAG CCG 
57141 57150 57159 57168 57177 57186 

CAA CTA CGG CTC CGT CCT CGA CCT CTT CGC CCC CGG TTC GTC CAT CAC CTC GGC 



QLRLRPRPLRPRFVHHLG 
NYG. SVLDLFAPGSS I TSA 
TTAPSSTSSPPVRPSPRP 
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SSLRSPSWCWRRYTSPSG 
PV*AVRRGVGDGTRRHRG 
QFELSEAVLVMEPVDIAV 



GAG CTT GAG TTC GCT GAG CCG CTG GTT GTG GTA GAG GCC ATG CAG CTA CCG CTG 
57195 57204 57213 57222 57231 57240 

CTG GAA CTC AAG CGA CTC GGC GAC CAA CAC CAT CTC CGG TAC GTC GAT GGC GAC 

LELKRL GDQHHLRYVDGD 
WNSSDSATNTI SGTSMAT 

gtqatrrptpspvrrwrp 

arpprrraggrrwgrpw'g 
rvhraggreveggvgrgg 
gctapaaaswraalgeav 

ggg cgt gca ccg ccc gcg gcg gcg cga ggt gga gcg gcg gtt ggg gag ccg gtg 

57249 57258 57267 57276 57285 57294 

CCC GCA CGT GGC GGG CGC CGC CGC GCT CCA CCT CGC CGC CAA CCC CTC GGC CAC 

PARGGRRRAPPRRQPLGH 
PHVAGAAALHLAANP SA T 
RTWRAPPRSTSPPTPRPP 

TGPRWPASTRRWWRRR*w 
RGLD GRRQRGGGGGADD G 
GDWTAVASVDAAVVP T TV 

GGG CAG GGT CCA GCG GTG CCG CGA CTG CAG GCG GCG GTG GTG GCC GCA GCA GTG 
57303 57312 57321 57330 57339 57348 

CCC GTC CCA GGT CGC CAC GGC GCT GAC GTC CGC CGC CAC CAC CGG CGT CGT CAC 

PVPGRH GADVRRHHRRRH 
PSQVATALTSAATTGVVT 
RPRSPRR*RPPPPPASSP 

GRCP SAWGAGTRRGAARG 
VGARARGVPEQVDAPPVV 
LGPVPEGLRSRYTPRRCS 

GTT GGG GCC GTG CCC GAG CGG GTT GGC CGA GGA CAT GCA GCC GGC CGC CGT GCT 
57357 57366 57375 57384 57393 57402 

CAA CCC CGG CAC GGG CTC GCC CAA CCG GCT CCT GTA CGT CGG CCG GCG GCA CGA 

QPRHGLAQPAPVRRPAAR 
NPGT GSPNRLLYVGRRHD 
TPARARPTGSCTSAGGT T 

GEPGASRSCRHSCS*RCS 
VRRARAELVGTVVRDAVV 
WGGPGRKSFVPS*VI LSL 



GGT GGG AGG CCC GGG CGC GAA GCT CTT 
57411 57420 57429 

CCA CCC TCC GGG CCC GCG CTT CGA GAA 



GTG GCC ACT GAT GTG CTA GTC GCT GTT 
57438 57447 57456 

CAC CGG TGA CTA CAC GAT CAG CGA CAA 
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HPPGPRFENTGDYTI SDN 
TLRARASRTPVTTRSATT 

WPRTGP SPRRRRRCRA R P 
GRDLGRHRDGADGAVRGR 
EVTSDGTVTEPTEPLAGE 

GAG GTG CCA GCT CAG GGG CCA CTG CCA GAG GCC GCA GAG GCC GTT GCG CGG GAG 
57465 57474 57483 57492 57501 57510 

CTC CAC GGT CGA GTC CCC GGT GAC GGT CTC CGG CGT CTC CGG CAA CGC GCC CTC 

LHGRVPGDGLRRLRQRAL 
S TVE SPVTVSGVSGNAP S 
PRSSPR*RSPASPATR PR 

GRRLPGCRGCTCRRGGPG 
GEGYLDVDDVRVDAVELD 
ARAT STWMTWVYMP SRWT 

CCG GGA GCG GCA TCT CCA GGT GTA GCA GGT GTG CAT GTA GCC GCT GGA GGT CCA 
57519 57528 57537 57546 57555 57564 

GGC CCT CGC CGT AGA GGT CCA CAT CGT CCA CAC GTA CAT CGG CGA CCT CCA GGT 

GPRRRGPHRPHVHRRPPG 
ALAVEVHIVHTYI GDLQV 
PSP*RSTSSTRTSATSRS 

ASRGRRCPTCA* TTRCRR 
LQDGGVARRVRE LRVAGA 
WSIAGSPVAYVSLDYPVP 

GGT CGA CTA GCG GGG GCT GCC GTG CCG CAT GTG CGA GTT CAG CAT GCC GTG GCC 
57573 57582 57591 57600 57609 57618 

CCA GCT GAT CGC CCC CGA CGG CAC GGC GTA CAC GCT CAA GTC GTA CGG CAC CGG 

PADRPRRHGVHAQVVRHR 
QLIAPDGTAYTLKSYGTG 
S*SPPTARRTRSSRTAPA 

CNPCC*CWTSPSRRRPPP 
ATRVVDVGRVRHVGGRLR 
PLESLMLVVYETFAEESA 

GCC GTC AAG CCT GTT GTA GTT GTG GTG CAT GAG CCA CTT GCG GAG GAG CCT CCG 
57627 57636 57645 57654 57663 57672 

CGG CAG TTC GGA CAA CAT CAA CAC CAC GTA CTC GGT GAA CGC CTC CTC GGA GGC 

RQFGQHQHHVLGERLLGG 
GSSDNINTTYSVNAS SEA 
AVRT T S TPRTR* TPP RRR 

WRCT SVAPSRCRSSRCRA 
GVARPFQPHAVVRVVVGP 
ALPVHF SRTLSLAF* SVP 



CCG GTT GCC GTG CAC CTT TGA CGC CCA CTC GCT GTT GCG CTT GAT GCT GTG GCC 
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5768'V 57690" 57699 57708" 577T7 57726 

GGC CAA CGG CAC GTG GAA ACT GCG GGT GAG CGA CAA CGC GAA CTA CGA CAC CGG 



GQRHVETAGERQRELRHR 
ANGTWKLRVSDNANYDTG 
PTARGNCG*ATTRTTTPG 

CLRRPAATRARGSWD* DD 
AYVGPRQLELGGQGTRTT 
RMSAQASCN*GERVLGLR 

CGC GTA TCT GCG GAC CCG CGA CGT CAA GAT CGG GAG GGA CTG GTC AGG ATC AGC 
57735 57744 57753 57762 57771 57780 

GCG CAT AGA CGC CTG GGC GCT GCA GTT CTA GCC CTC CCT GAC CAG TCC TAG TCG 

AHRRLGAAVLALPDQS * S 
RIDAWALQF*PSLTSPSR 
A*TPGRCSSSPP*PVLVV 

ERCPVPDRGPWGRPRGVD 
RAARCR T GVRGVALVVW T 
GRPVAGP GSGAL R S S S GR 

AGG AGC GCC GTG CCG TGG CCC AGG GCT GGG CCG GTT GGC GCT CCT GCT GGG TGC 
57789 57798 57807 57816 57825 57834 

TCC TCG CGG CAC GGC ACC GGG TCC CGA CCC GGC CAA CCG CGA GGA CGA CCC ACG 

SSRHGTGSRPGQPRGRPT 
PRGTAP GPDPANREDD PR 
LAARHRVPTRPTARTTHV 

PGPVGGGALSDLGAPRPP 
RGRCAAEPLPTSARQAPH 
GAGARRRRCPLRPGSPPT 

AGG CCG GGG CCG TGC GGC GGA GGC CGT TCC CTC AGC TCC GGG CGA CCC GCC CCA 
57843 57852 57861 57870 57879 57888 

TCC GGC CCC GGC ACG CCG CCT CCG GCA AGG GAG TCG AGG CCC GCT GGG CGG GGT 

SGPGTPPPARESRPAGRG 
PAPARRLRQGSRGPLGGV 
RPRHAASGKGVEARWAGW 

YPTGGGLGKSCPTDGAVC 
TRPAEGWARRAPPTGL *A 
PVPHRGGLGELLPHGWSR 

CCC ATG CCC CAC GGA GGG GGG TTC GGG AAG CTC GTC CCC CAC AGG GGT CGA TGC 
57897 57906 57915 57924 57933 57942 

GGG TAC GGG GTG CCT CCC CCC AAG CCC TTC GAG CAG GGG GTG TCC CCA GCT ACG 

GYGVPPPKPFEQGVSPAT 
GTGCLPPSPSSRGCPQLR 
VRGASPQALRAGGVPSYA 

AA G I PR T GGRAR L R T R R S 
HQAS PARVGVPGCDRVAP 
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GTA CGA CGC GGC TAC CCC GCG CAT GGG GGT GCC CGG GCG TCA GCG CAT GCC GCC 
57951 57960 57969 57978 57987 57996 

CAT GCT GCG CCG ATG GGG CGC GTA CCC CCA CGG GCC CGC AGT CGC GTA CGG CGG 

HAAPMGRVPPRAR SRVRR 
MLRRWGAYPHGPAVAYGG 
CCAD6ARTP TGPQSRT AG 

PSTDPPTRGCHGADVRPV 
LPRTPPHGGATVPTLVRC 
FPVHRPTDARL SRR* CAA 

CTT CCC CTG CAC AGC CCC CCA CAG GCG GGC GTC ACT GGC CGC AGT TGT GCG CCG 
58005 58014 58023 58032 58041 58050 

GAA GGG GAC GTG TCG GGG GGT GTC CGC CCG CAG TGA CCG GCG TCA ACA CGC GGC 

E GDVS GGVRPQ*PAS TR G 
KGTCRGVSARSDRRQHAA 
RGRVGGCPPAVTGVNTRH 

EQGLPAAPGLVSVGRRPG 
RRAWPHRRDSSPCGGARG 
GGPGLTGGTRPRVGGPAA 

TGG AGG ACC GGG TTC CCA CGG CGG CCA GGC TCC TGC CTG TGG GGG GCC GCG CCG 
58059 58068 58077 58086 58095 58104 

ACC TCC TGG CCC AAG GGT GCC GCC GGT CCG AGG ACG GAC ACC CCC CGG CGC GGC 

TSWPKGAAGPRTDTPRRG 
PPGPRVPPVRGRTPPGAA 
LLAQGCRRSEDGHPPARP 

SGCRLGLSRAGGGVGWLG 
RGVVCGLAVRVGVWGGCA 
GVWLAVWP*ACGWGGGVP 

GGG CTG GGT GTT GCG TTG GGT TCC GAT GCG CGT GGG GGT GGG TGG GGG GTG TCC 
58113 58122 58131 58140 58149 58158 

CCC GAC CCA CAA CGC AAC CCA AGG CTA CGC GCA CCC CCA CCC ACC CCC CAC AGG 

PDPQRNPRLRAPPPTPHR 
PTHNATQGYAHPHPPPTG 
RPT TQPKATRTPTHPPQA 

GCAHARAGG GGRS *WRRP 
AAPMRVRVGVVAPDGGEP 
RRLCACACGWWRP IVVKP 

GGC GGC GTC CGT ACG CGT GCG CGT GGG GGT GGT GGC GCC CTA GTG GTG GAA GCC 
58167 58176 58185 58194 58203 58212 

CCG CCG CAG GCA TGC GCA CGC GCA CCC CCA CCA CCG CGG GAT CAC CAC CTT CGG 

PPQACARAPPPPRDHHLR 
RR R HAHAHPHHRGITTFG 
AAGMRTRTPTTAGSPP SG 
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GWKTGGRGGSVMRGTTRW 
DGNRGAEGGA*WEGLRVG 
TGMEDRRAGRKGNAWDYA 

CCA GGG GTA AAG CAG GGC GGA GCG GGG GGC GAA TGG TAA GCG GGT CAG CAT GCG 
58221 58230 58239 58248 58257 58266 

GGT CCC CAT TTC GTC CCG CCT CGC CCC CCG CTT ACC ATT CGC CCA GTC GTA CGC 

GPHFVPPRPPLTIRPVVR 
VPI SSRLAPRLPFAQSYA 
SPFRPASPPAYHSPSRTP 

NGGGPGAARVLLVT GTDM 
TGAARGQRGFWSCPVRTW 
LERRGARGGSGPARYGHG 

GTC AAG GGC GGC GGG CCG GGA CGG CGG GCT TGG TCC TCG TGC CAT GGG CAC AGG 
58275 58284 58293 58302 58311 58320 

CAG TTC CCG CCG CCC GGC CCT GCC GCC CGA ACC AGG AGC ACG GTA CCC GTG TCC 

QFPPPGPAARTRSTVPVS 
SSRRPALPPEPGARYPCP 
VP AARPCRPNQEHGTRVH 

GGGGPGWCGCPDGSCGWP 
VEAGRVGVAALTGPAAGL 
YRRGGSGLLRLPGRLLGL 

TAT GGA GGC GGG GGG CCT GGG GTT GTC GGC GTT CCC AGG GGC CTC GTC GGG GTT 
58329 58338 58347 58356 58365 58374 

ATA CCT CCG CCC CCC GGA CCC CAA CAG CCG CAA GGG TCC CCG GAG CAG CCC CAA 

IPPPPGPQQPQGSPEQPQ 
YLRPPDPNSRKGPRSSPK 
TSAPRTPTAARVPGAAPR 

CFACPWYGGGDGYGCPAG 
ASRAPGTGAVTAMGARRV 
PLVRLALVRWRRWVRVAC 

CCC GTC TTG CGC GTC CCG GTC ATG GGC GGT GGC AGC GGT ATG GGC GTG CCG CGT 
58383 58392 58401 58410 58419 58428 

GGG CAG AAC GCG CAG GGC CAG TAC CCG CCA CCG TCG CCA TAC CCG CAC GGC GCA 




GGG CCC CGG GGC CCT GGC ATG CGC ATG 
58437 58446 58455 

CCC GGG GCC CCG GGA CCG TAC GCG TAC 



GTG GTG GGG ATG CCG AGG GTG TCG GGG 
58464 58473 58482 

CAC CAC CCC TAC GGC TCC CAC AGC CCC 
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PGPRDRTRTTTPTAPTAP 
RGPGTVRVPPPLRLPQPL 

PRGAGTLPTAMPARTRPM 
RGGRVR*RRRWRRGPGRC 
VAAGC GDVADGDAGQD E A 

ATG CCG GCG GGG CGT GGG CAG TTG CCG CAG CGG TAG CCG CGG GAC CAG GAG CCG 
58491 58500 58509 58518 58527 58536 

TAC GGC CGC CCC GCA CCC GTC AAC GGC GTC GCC ATC GGC GCC CTG GTC CTC GGC 

YGRPAPVNGVAIGALVLG 
TAAPHPSTASPSAPWSSA 
RPPRTRQRRRHRRPGPRH 

RQKRGATPSTSPSIASAC 
GRSEAPRLAPAPVSRAPA 
DEAKQRGYPQHQSQDRQR 

TAG GAG ACG AAA GAC GGC CGG CAT CCC GAC CAC GAC CCT GAC TAG CGC GAC CGC 
58545 58554 58563 58572 58581 58590 

ATC CTC TGC TTT CTG CCG GCC GTA GGG CTG GTG CTG GGA CTG ATC GCG CTG GCG 

ILCFLPAVGLVLGLIALA 
SSAFCRP*GWCWD*SRWR 
PLLSAGRRAGAGTDRAGA 

ILFRPSRPLPMAIAPET S 
S*SAPRALCPCPSLRNPA 
LDLLPALSALAHRYGTRH 

GTC TAG TTC TTC GCC CCG CTC GCT CCG TTC CCG TAC CGC TAT CGG CCA AGC CAC 
58599 58608 58617 58626 58635 58644 

CAG ATC AAG AAG CGG GGC GAG CGA GGC AAG GGC ATG GCG ATA GCC GGT TCG GTG 

QIKKRGE.RGKGMAIAGSV 
RSRSGASEARAWR*PVRC 
DQEAGRARQGHGDSRFGA 

EQTP STRHVT DSDVPKVE 
RRRRVRGTSPTATWPS * R 
E G AD S E DQ PRHRQ GR A E G 

GAG AGG ACG CAG CCT GAG CAG GAC ACC TGC CAC AGC GAC AGG TGC CCG AAG TGG 
58653 58662 58671 58680 58689 58698 

CTC TCC TGC GTC GGA CTC GTC CTG TGG ACG GTG TCG CTG TCC ACG GGC TTC ACC 

LSCVGLVLWTVSLSTGFT 
SPASDS SCGRCRCPRASP 
LLRRTRPVDGVAVHGLHL 

STTSPKLSAALPSPVG*A 
RRRRRS *PRRSRRPCGRR 
GVDDVAELVGRAALAGGV 



AGG CTG CAG CAG CTG CCG AAG TTC CTG CGG CGC TCG CCG CTC CCG TGG GGG ATG 
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58707 587T6' 58725 ^ 58734* 5 B743* ' * 58752 

TCC GAC GTC GTC GAC GGC TTC AAG GAC GCC GCG AGC GGC GAG GGC ACC CCC TAC 



SDVVDGFKDAASGEGTPY 
PTSSTASRTPRAARAPPT 
RRRRRLQGRRERRGHPL] 

RALPSQKSEAVSVRSPAJ 
GRWPRSSRSPSRCGPPRp 

GEGLAVAEVRRGVGQLAR 

CGG GAG CGG TTC CCG CTG ACG AAG CTG AGC CGC TGG CTG TGG GAC CTC CCG CGC 
58761 58770 58779 58788 58797 58806 

GCC CTC GCC AAG GGC GAC TGC TTC GAC TCG GCG ACC GAC ACC CTG GAG GGC GCG 

ALAKGDCFDSATDTLEGA 
PSPRATASTRRPTPWRAR 
PRQGRLLRLGDRHPGGR ( 

*STSS TGQEAACSPSTNi 
RRRPRPARSRRARRRPTR 
GVVHVLHGAGGRVVAL H E 

CGG ATG CTG CAC CTG CTC CAC GGG ACG AGG CGG CGC GTG CTG CCG CTC CAC AAG 
58815 58824 58833 58842 58851 58860 

GCC TAC GAC GTG GAC GAG GTG CCC TGC TCC GCC GCG CAC GAC GGC GAG GTG TTC 

AYDVDEVPCSAAHDGEVF 
PTTWTRCPAPPRTTARCS 
LRRGRGALLRRARRRGVI 

TTVRGPPAKGPSSSSVRT 
PR*GGRRRRGPRRRV*GS 
RDDGEGAAGERAVVFEGP 

CGC CAG CAG TGG GAG GGG CCG CCG CGG AAG GGC CCG CTG CTG CTT GAG TGG GCC 
58869 58878 58887 58896 58905 58914 

GCG GTC GTC ACC CTC CCC GGC GGC GCC TTC CCG GGC GAC GAC GAA CTC ACC CGG 

AVVTLPGGAFPGDDELTR 
RSSPSPAAPSRATTNSPG 
GRHPPRR RLPGRRRTHP I 

ASSLH*ASEAAVGHVGPC 
RRPCTNRARRR*AMSVQA 
GGLVLTVREGGSRWPCRP 

TGG CGG CTC CTG TTC ACA ATG CGC GAG AGG CGG CGA TGC GGT ACC TGT GGA CCC 
58923 58932 58941 58950 58959 58968 

ACC GCC GAG GAC AAG TGT TAC GCG CTC TCC GCC GCT ACG CCA TGG ACA CCT GGG 

TAEDKCYALSAATPWTPG 
PPRTSVTRSP PLRHGHLG 
RRGQVLRALRRYAMDTW I 

YR.uVVRVDVVEDRGALA P ? 
TGSSAST**KMGVRWLQR 
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GGC ATG GCC TGC TGC GCC TGC AGA TGA TGA AGT AGG GCT GGG CGG TCT CGA CCG 
58977 58986 58995 59004 59013 59022 

CCG TAC CGG ACG ACG CGG ACG TCT ACT ACT TCA TCC CGA CCC GCC AGA GCT GGC 

PYRTTRT STTSSRPARAG 
RTGRRGRLLLHPDPPELA 
VPDDADVYYFIPTRQSWR 

EAVALDGAQEAGRLVVAL 
KPSRSIVQRNPAVCSSPL 
SRRGRS *RGTRRWAPRRC 

CGA AGC CGC TGG CGC TCT AGT GGA CGG ACA AGC CGC GGT GCG TCC TGC TGC CGT 
59031 59040 59049 59058 59067 59076 

GCT TCG GCG ACC GCG AGA TCA CCT GCC TGT TCG GCG CCA CGC AGG ACG ACG GCA 

ASATARSPACSAPRR TTA 
LRRPRDHLPVRRHAG RRQ 
FGDREI TCLFGATQDDGK 

QGA*QAAVRRCEVGVLDG 
SVPESRLSGVVSSASWTA 
ASRSVACRGSSVRRRGPR 

TCG ACT GGC CGA GTG ACG CGT CGC TGG GCT GCT GTG AGC TGC GGC TGG TCC AGC 
59085 59094 59103 59112 59121 59130 

AGC TGA CCG GCT CAC TGC GCA GCG ACC CGA CGA CAC TCG ACG CCG ACC AGG TCG 

S*PAHCAATRRHSTP TRS 
ADRLTAQRPDD TRRRPGR 
LTGS LR S DPTTLDADQVA 

EEGRG. VGDVGRQVLLRL F 
KREAVLATSVASYSSGS S 
RGRRSWRRRCRATRPAPP 

GGA AGG AGA GGC GCT GGT TGC GGC AGC TGT GGC GCG ACA TGC TCC TCG GCC TCC 
59139 59148 59157 59166 59175 59184 

CCT TCC TCT CCG CGA CCA ACG CCG TCG ACA CCG CGC TGT ACG AGG AGC CGG AGG 

PSSPRPTPSTPRCTRSRR 
LPLRDQRRRHRAVRGAGG 
FLSATNAVDTALYEEPEE 

VRLVVQGRVLGPRLVDVG 
YASS SRAAFLAQAFSTWA 
IRPPRGPRSCPRPSPRGR 

TTA TGC GCC TCC TGC TGG ACC GGC GCT TGT TCC GGA CCC GCT TCC TGC AGG TGC 
59193 59202 59211 59220 59229 59238 

AAT ACG CGG AGG ACG ACC TGG CCG CGA ACA AGG CCT GGG CGA AGG ACG TCC ACG 

NTRRTTWPRTRP GRRTST 
IR-GGRPGREQGLGEGRPR 
YAEDD LAANKAWAKDVHA 
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healldlaarvcsasprr 

TSPSCI SPQASVAPRLAG 
RARRASRPSRPCLQGFPA 

GGC ACG AGC CGC TCG TCT AGC TCC CGA CGC GCC TGT GTC GAC CGG CTT CCC GCG 
59247 59256 59265 59274 59283 59292 

CCG TGC TCG GCG AGC AGA TCG AGG GCT GCG CGG ACA CAG CTG GCC GAA GGG CGC 

PC SASRS RAARTQLAE GR 
R A R R A DRGLRGHSWPKGA 
VLGEQIEGCADTAGRRAP 

RAPRRDPRPSPPRGSPSP 
GLRDGIQDLLHLVGPLVP 
ASGTASRTSSISSARFSQ 

GCG GCT CGG CCA GCG GCT AGA CCA GCT CCT CTA CCT CCT GCG GGC CTT CCT GAC 
59301 59310 59319 59328 59337 59346 

CGC CGA GCC GGT CGC CGA TCT GGT CGA GGA GAT GGA GGA CGC CCG GAA GGA CTG 

RRAGRRS GRGDGGRP E GL 
AEPVADLVEEMEDARKDW 
PSRSPIWSRRWRTPGRTG 

SPPPPWSRPCTSC .TSRCR 
RLRRRGRVRVRVVRVVVA 
AFAAAAVFASVY*VY* S L 

CCG CTT CCG CCG CCG CCG GTG CTT GCG CCT GTG CAT GAT GTG CAT GAT GCT GTC 
59355 59364 59373 59382 59391 59400 

GGC GAA GGC GGC GGC GGC CAC GAA CGC GGA CAC GTA CTA CAC GTA CTA CGA CAG 

GE GGGGHERGHVLHVLRQ 
AKA .AAAT NADTYYTYYD S 
RRRRRPRTRTRTTRTTTA 

IRTRRRGRSR*RACPEPG 
SVLVDVA GRGDGRAL SQA 
PYSYTSPGAVTVARLARP 

GCC TAT GCT CAT GGA GCT GCC GGG GCG CTG GCA GTG GCG CGC GTT CCG AGA CCC 
59409 59418 59427 59436 59445 59454 

CGG ATA CGA GTA CGT CGA CGG CCC CGC GAC CGT CAC CGC GCG CAA GGC TCT GGG 

RIRVRRR PRDRHRAQGSG 
GYEYVD GPATVTARKAL G 
DTSTSTAPRPSPRARLWA 

PCWRAT TRPPGRCRRCR S 
QVGGHRRVLLVGAGAVAP 
RSVVTGDYSSSGPVPSLP 



GGA CCT GTG GTG GCA CGG CAG CAT GCT 
59463 59472 59481 

CCT GGA CAG CAC CGT GCC GTC GTA CGA 



CCT CCT GGG GCC GTG GCC GCT GTC GCC 
59490 59499 59508 

GGA GGA CCC CGG CAC CGG CGA CAG CGG 
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LDTTVPSYEEDPGTGDSG 
WTPPCRRTRRTPAPATAG 

RPRCRRRG*HTLPPTLAA 
ALAAAAAAEIHSRLH SRp 

LSPPLPPPRLTHASTHAR 

CTC GCT CCC GCC GTC GCC GCC GCC GGA GTT ACA CAC TCG CCT CCA CAC TCG CGC 
59517 59526 59535 59544 59553 59562 

GAG CGA GGG CGG CAG CGG CGG CGG CCT CAA TGT GTG AGC GGA GGT GTG AGC GCG 

ERGRQRRRPQCV S GGV S A 
SEGGSGGGLNV*AEV* AR 
ARAAAAAAS MCERRCERG 

IAPLFHRRLARRVCLDDC 
*LPSFTGAYLGGCACTMV 
SYRPSLAQTFG EARVL * * 

CGA TAT CGC CCC TCT TTC ACG GAC GCA TTT CGG GAG GCG TGC GTG TTC AGT AGT 
59571 59580 59589 59598 59607 59616 

GCT ATA GCG GGG AGA AAG TGC CTG CGT AAA GCC CTC CGC ACG CAC AAG TCA TCA 

AIAGRKCLRKALRTHKS S 
L*RGESACVKPSARTSHH 
YSGEKVPA*SPPHAQVI T 

RTIRQGKSARSLGPNGPQ 
DLSERAKAQVPCGLTAL S 
MSHNEPRQKCPVVWPQWA 

GTA GCT CAC TAA GAG ACC GGA AAC GAA CGT GCC CTG TTG GGT CCC AAC GGT CCG 
59625 59634 59643 59652 59661 59670 

CAT CGA GTG ATT CTC TGG CCT TTG CTT GCA CGG GAC AAC CCA GGG TTG CCA GGC 

HRVILWPLLARDNPGLPG 
IE*FSGLCLHGTTQGCQA 
SSDSLAFACTGQPRVARL 

QQRYLS IPA ALSKRHAAP 
NSDTCASPLPWHSETLLR 
TATQVLQHSRGTVKPSCG 

ACA ACG ACA GAC ATG TTC GAC TAC CCT CGC CGG TCA CTG AAA GCC ACT CGT CGG 
59679 59688 59697 59706 59715 59724 

TGT TGC TGT CTG TAC AAG CTG ATG GGA GCG GCC AGT GAC TTT CGG TGA GCA GCC 

CCCLYKLMGAASDFR * A A 
VAVC T S * WERPVT F G E Q P 
LLSVQADGSGQ*LSVSSR 

TGARRPHDGCSSR*RNVA 
HVQADRT IEALLDDVT *Q 
TYRRTAPSRRLFITLPE S 



CCA CAT GGA CGC GCA GCG CCC ACT AGA GGC GTT CTT CTA GCA GTT GCC AAG TGA 
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59733 59T42 ' 59T5T 59760 59T69 59778 

GGT GTA CCT GCG CGT CGC GGG TGA TCT CCG CAA GAA GAT CGT CAA CGG TTC ACT 




VACGGGTGPWSG 
WRVGAERGLG'PD 
GGCVRRGDWALI 



CGG TGG CGT GTG GGC GGA GGG CAG GGT CCG GTC CTA GG 5' 

59787 59796 59805 59814 

GCC ACC GCA CAC CCG CCT CCC GTC CCA GGC CAG GAT CC 3' 



ATAHPPPVPGQD 
PPHTRLPSQARI 
HRTPASRPRPGS 
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